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Avant-propos 


Ce cours de probabilités fait suite au livre Calcul des Probabilités, cours, exer- 
cices et problèmes corrigés (Dunod, Paris, seconde édition, 1998} écrits par 
les mêmes auteurs; il présuppose, en principe, la connaissance des matières 
exposées dans ce précédent livre. Le présent cours reste, cependant, acces 
sible à toute personne ayant acquis les connaissances de base du calcul 
des probabilités, telles qu’elles sont enseignées dans les cours de licence de 
mathématiques (bac+3) des Universités. Il sera fait naturellement référence 
au livre cité, dit volume 1, sous l’appellation { FF13, mais les notations utilisées 
sont suffisamment classiques pour que tout lecteur préparé n'ait aucun mal à 
aborder la lecture de celui-ci. Un premier chapitre intitulé Notations utilisées 
et rappels a été inclus pour permettre une entrée en matières aisée. 

Le présent cours s'adresse aux étudiants de maîtrise de mathématiques ap- 
pliquées et d'informatique (bac+4), ainsi qu'aux élèves des grandes écoles 
d'ingénieurs qui s’orientent vers la recherche opérationnelle. L'esprit du 
précédent volume a été conservé : à la fin de chaque chapitre, à l'exclusion du 
premier qui contient les rappels et de l’avant-dernier qui contient des exemples 
d'applications, on trouve un ensemble d’exercices, qui reçoivent des solutions 
souvent détaillées. 

Ce cours a pris corps à l’Université Louis Pasteur, dans le programme du 
magistère d’actuariat (bac +3 à +5), lorsque chacun des auteurs, à tour de 
rôle, à assuré les cours de probabilités. Une fois acquises les connaissances 
exposées dans FF1, au cours de la première année et du premier semestre de 
la deuxième année, les étudiants engagés dans ce programme s’initient aux 
éléments de la théorie des processus stochastiques, durant le second semestre 
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de la deuxième année et le premier semestre de la troisième. Nous avons donc 
conçu un cours reposant sur trois processus très classiques : les processus de 
Poisson, les chaînes de Markov à valeurs discrètes, les martingales à temps 
discret. Nous terminons l'ouvrage par une étude sur le mouvement brownien. 

Naturellement, processus de Poisson et chaînes de Markov ont fait l’objet 
de nombreux exposés. On les trouve traités dans les cours de Neveu [8] et 
Carton [2]. Il existe aussi un excellent ouvrage sur le seul processus de Poisson 
par Kingman 5]. La théorie des chaînes de Markov est traitée dans le classique 
ouvrage de Feller [4] et dans bien d’autres livres plus anciens. 

La théorie des martingales à temps discret est traitée de façon exhaustive 
par Neveu [7]. Voir aussi le livre pétillant de Williams [9] ou le très classique 
manuel de Bauer [1]. Comme cette théorie est plus récente (elle à quand 
même soixante ans!), les exercices sont moins classiques. Nous avons, pour 
cette partie, bénéficié des précieux conseils de notre collègue Giorgio Letta. 
Mentionnons, enfin, le traité de Loève [6], avec son chapitre sur le mouvement 
brownien et aussi le superbe livre d'exercices rédigé par les probabilistes 
ukrainiens [3]. 

Le premier chapitre contient un rappel sur les règles de calcul des espérances 
conditionnelles, auquel nous nous sommes constamment reportés pour le 
traitement de la théorie des martingales dans les chapitres 7-11. Le livre se 
termine par un chapitre traitant d'exemples d'applications et par une brève 
étude sur le mouvement brownien. Comme ce processus est désormais un 
ingrédient fréquent dans certains modèles de mathématiques financières, nos 
étudiants ont accueilli avec sympathie un tel chapitre dans notre ouvrage. 

Beaucoup d'exercices sont classiques. Certains sont nouveaux, ou rédigés 
de façon nouvelle. Une grande partie d’entre eux ont été testés auprès des 
étudiants du Magistère d’actuariat. Nous les remercions de nous avoir fait 
part de leurs critiques. Nous sommes, encore une fois, reconnaissants à Anatole 
Joffe pour toutes ses remarques bienveillantes et érudites, ainsi qu’à Michel 
Émery et Jacques Franchi pour leurs commentaires éclairés, notamment sur 
le mouvement brownien. 

Comme le souhaitait l'éditeur, le texte a été mis, par les auteurs, en 
conformité avec la charte de présentation des Éditions Dunod. Les théorèmes, 
propositions, propriétés ont reçu une numérotation absolue. Par exemple, le 
{Théorème 8.2.1» est le premier théorème apparaissant dans le deuxième 
paragraphe du chapitre 8. Les définitions également sont pourvues d’une telle 
numérotation. En revanche, les remarques sont le plus souvent mentionnées 
sans aucune numérotation. 
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Les auteurs voudraient remercier Vanessa Beunèche, des Éditions Dunod, 
pour sa lecture attentive du texte et pour ses remarques avisées, qui ont 
amélioré la présentation typographique finale. Ils sont, enfin, reconnaissants 
à André Violante, qui a leur a fait part de toutes ses innovations en matière 
de typographie informatique. 
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Chapitre Premier 


Notations utilisées et Rappels 


Le but de ce premier chapitre est d'exposer rapidement les notions de 
base des probabilités, telles qu’elles ont été développées, par exemple, dans 
le livre publié précédemment par les mêmes auteurs! et de préciser les 
notations qui seront constamment utilisées dans le présent ouvrage. À la fin de 
chaque paragraphe, est donnée une référence au livre cité, sous l'appellation 
«FF1». Le chapitre se termine par un exposé de quelques propriétés des 
tribus engendrées par des variables aléatoires ($ 12) et par un traitement des 
espérances conditionnelles ($ 13), dont l’usage est constant dans la théorie des 
martingales. On imagine que le lecteur fera une première lecture rapide de ce 
chapitre, quitte à y revenir pour s'assurer d’une notation ou d’une propriété 
sur les espérances conditionnelles. 


11 LE TRIPLET FONDAMENTAL 


Il est noté (,2,P) et consiste en un ensemble non-vide {, un ensemble X 
de parties de {?, muni d’une structure de éribu et une mesure de probabilité P 
sur la tribu %. Les éléments de Q sont les épreuves attachées au problème 
sous-jacent et les éléments de la tribu 2 sont les évènements auxquels on peut 
attacher une probabilité. Le triplet est appelé espace probabilisé. 

Les opérations ensemblistes, comme la réunion et l'intersection, conservent 
leurs notations classiques. Le complémentaire d'un évènement À est noté A°. 


! Foata (Dominique) & Fuchs (Aimé). — Calcul des probabilités; cours, exercices et 
problèmes corrigés, 2ème édition. — Paris, Dunod, 1998. 


2 1e Notations utilisées et Rappels 


Si les évènements À et B sont disjoints (on dit encore incompatibles), on écrit 
aussi A+ B pour la réunion AU B. La différence AN B° entre l'évènement À 
et l'évènement B est notée 4 \ B. 

Pour une suite {A,) d'évènements, on construit les évènements : [, 4, «au 
moins l'un des À, se réalise» ; f}, 4, «tous les À, se réalisent »; liminf, 4, 
«tous les À, se réalisent après un certain indice»; limsup,, 4, {une infinité 
d'évènements À, se réalisent». Si les évènements 4, sont disjoints deux à 
deux, on écrit aussi >, 4, pour la réunion [J, Ax. À chaque évènement À, 
on associe son indicatrice, notée T4, qui est la fonction, définie sur Q, valant 1 
sur À et 0 ailleurs. 

La tribu engendrée par une famille C d'évènements est notée T{C). C’est 
la plus petite tribu, pour la relation d'inclusion, qui contient €. La tribu 
borélienne sur R est notée B!. Elle est, par exemple, engendrée par la classe 
des intervalles fermés bornés. La tribu borélienne de R” est notée B*. On peut 
la définir comme la tribu engendrée par la famille des pavés bornés, à savoir 
les produits d’intervalles fermés bornés : [I {a;,b;]. 

Voir [FF1], chap. 1, 2 et 3. 1<i<n 


1.2 LE THÉORÈME BINOMIAL 


Ce théorème intervient si souvent dans les calculs explicites, qu’il paraît 
important de rappeler son énoncé. Si n est un entier positif et a un élément 
de €, la factorielle montante est définie par 


(ah := 1, sin=0; 
. afa+1}-..(a+n-1), sin>1. 


La fonction kypergéométrique, dépendant d’une suite de p paramètres a, ..., 

a et d’une suite de g paramètres b1,...,b, est la série de puissances en x : 
(ai)n: 2: (ap}n 2° 

n50 (b1}n:* (bg}n aÙ 


Lorsque p = 4 — 0, la fonction hypergéométrique est simplement la fonction 
exponentielle 


n 


of ia) =Y 5 = expt. 


n>20 


Lorsque p = 1 et g = 0, la fonction hypergéométrique peut être sommée pour 
tout x tel que [x] < 1. On obtient l'identité du théorème binomial : 


Be) = ECO a {ae 
n>0 ° 


Le coefficient binomial () (où a est un complexe et n un entier positif) est 
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défini par : ( ‘= De nt cree, 


L'identité de Chu- Vandermonde s'exprime par : 


2A(7%%;1) = Ce. 


Voir [FF1}, chap. 3. 


13 CONDITIONNEMENT ET INDÉPENDANCE 


Si À est un évènement de probabilité P(A) > 0, la mesure de probabilité 
conditionnelle, À étant donné, associe à tout évènement B la probabilité 
P(B}4) := P(BN A)/P(A). La formule du conditionnement en chaîne 
s'exprime en disant que si n > 2 et si A;,42,...,A4, est une suite de n 
évènements tels que P(A1A2...An-1) > 0, on a l'identité : 


(31) P(A14o... An) 
= P(Au A1... An-1)P(An1 | A1... no) + P(42| A41)P(A:). 


On dit qu’une suite (An) d'évènements est un système complet si 
() i#j= ANA; = 4 (les évènements sont deux à deux incompatibles) ; 
() PO An) = Xn P(An) = 1 (presque sûrement lun des évènements Ar 
se réalise). 

Deux évènements À et B sont indépendants si l’on a P(ANB) = P(A)P(B). 
Soit (X,) une suite de variables aléatoires. On dit que c’est une suite de 
variables (mutuellement) indépendantes, si pour toute suite finie {é; < --: < 
&) d’entiers telle que r > 2 et toute suite (B:,..., B,) d’ensembles boréliens, 
on a l'identité : P{X:, € B1,..., Xi, € B,} = P{X € Bi}... P{X; € B,}. 

Voir [FF1}, chap. 6. 


1.4 PROBABILITÉS DISCRÈTES ET VARIABLES ALÉATOIRES 


La mesure de probabilité singulière en wo est notée €. Pour chaque 
évènement À, on a £(AÀ) = 1 ou 0, suivant que À contient wo ou non. Si 
(an) est une suite de nombres positifs tels que la somme de la série X,, a 
vaut 1 et si (wn) est une suite d'éléments de (, la somme Y, ane, est une 
mesure de probabilité discrète, portée par la suite (w,). 

On utilise cette notation pour exprimer les lois de probabilité discrètes 
usuelles, comme la loi binomiale B(n,p) := 3, (x)p*g""Ëez (avec q = 1—p) 
ou la loi de Poisson zx := Eysoe* (AF/kl}ez, ou encore la loi géométrique, 
qui apparaît sous les deux formes 5.1 pt lez et Dyoopal ex. 

Les variables aléatoires sont notées X, Ÿ, ... avec ou sans indices. Si elles 
sont définies sur l’espace probabilisé (Q,%, P) et si B est un ensemble borélien, 
alors {X € B} est l'évènement {w € N : X(w) € B}. La loi de probabilité de X 
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est notée Px ; elle est définie, pour tout B € B!, par Px(B) := P(X-1(B)) = 
P{X € B}. La fonction de répartition de X est la fonction de variable réelle, 
à valeurs dans [0,1], définie par : Fx(x) := P{X < x}. 

Si la loi de probabilité de X est discrète, soit Px = , ane, et si la série 
Ln An tn] est convergente, l'espérance mathématique de X est définie par 
E[X := X, antn. 

Si X est une variable aléatoire prenant ses valeurs dans N = {0,1,...}, 
sa fonction génératrice est la série de puissances Gx(s) := 5, P{X = n}s7. 
Si la série Gx(s) est dérivable à gauche en s = 1, on a : E[X] = G,(1). Si 
(N,X1,Xo,... } est une suite de variables aléatoires indépendantes, toutes à 
valeurs dans N, si les X; ont même loi que la variable aléatoire X, alors la 
fonction génératrice de la somme aléatoire Sn := X1 +--- + Xn est donnée 
par Gs,(s) = GN(Gx(s)). 

Voir [FF1}, chap. 69. 


15 INTÉGRATION 


On définit l'espérance mathématique E[X] d'une variable aléatoire réelle X, 
comme l'intégrale f X dP, si elle existe, de X par rapport à la mesure P, de 
sorte que les propriétés de l'espérance mathématique résultent des propriétés 
de l'intégrale. 

Soit f une fonction mesurable réelle d’une variable réelle. Le théorème de 
transfert permet de «transférer» le calcul de l'intégrale de f o X par rapport 
à P, en un calcul d’intégrale sur R, par rapport à la mesure de probabilité Px. 
Ona: fofo XdP = fr f dPx; en particulier, E[X] = fR # dPx(x), avec les 
conventions habituelles sur les convergences d’intégrales. 

Soit f une fonction réelle, positive, d'une variable réelle, d'intégrale de 
Lebesgue égale à 1 sur R. On dit qu’une variable aléatoire réelle est absolument 
continue, de densité f, si pour tout ensemble borélien B, on a Px{B) = 
J2 f(x) dx. Soit g une fonction (mesurable) réelle d’une variable réelle. Alors 
Je 9x) dPx(x) JR g(x)f(x) dx, avec les conventions habituelles sur les 
convergences d’intégrales. 

Soient X et Y deux variables aléatoires réelles, indépendantes, de fonctions 
de répartition respectives F et G. Alors la somme X + Y a pour fonction de 
répartition le produit de convolution de F et G, donné pour tout réel 2 par : 


(F + Ga) = [ F(2— y) d@(#). 


Si X et Ÿ sont absolument continues de densités respectives f et g, alors 
X +Ÿ a une densité donnée par le produit de convolution 


Gx9@ = [re voté. 
Voir [FF], chap. 10-11. 


18 Lois normales et exponentielles, loi gamma 5 


1.6 VECTEURS ALÉATOIRES 


Soit (X,Ÿ) un couple de variables aléatoires réelles définies sur un espace 
probabilisé (Q,%,P). La loi de probabilité de (X,Y) est définie, pour tout 
borélien B € B?, par P{x.y)(B) := P{(X,Y) € B}. La loi du couple détermine 
complètement les lois de chacune des variables X et Y. 

On dit que le couple (X,Y) est absolument continu, de densité fxy), si 
fcx,y) est une fonction réelle, de deux variables réelles, d’intégrale égale à 1 sur 
R? et si, pour tout borélien B € #?,on a: P{xv(B)= fe fix vite, u) dady. 
Soit F(xy(x,y) la fonction de répartition de (X,Y), égale à P{X < 
2, Ÿ < y}. Alors, si f{x,y) est continue en (x0,%0), on à : f{x;yy(to, vo) = 
(97/(0x 0y)F(x,y)(&,#) au point (x,y) = (xo, yo). 

Les densités de X et Y sont données par : 


Bo= [fxntanan  Ao= fiantenar. 


Les variables aléatoires X et Y sont indépendantes si et seulement si l’on à 

fxvite, y) = fx(x)fv(y) à un ensemble de mesure (de Lebesgue) près sur 

R?. Le rappel sur les densités conditionnelles est fait dans le paragraphe 13. 
Voir [FF1], chap. 12. 


1.7 FONCTIONS GÉNÉRATRICE ET CARACTÉRISTIQUE 


Soit X une variable aléatoire réelle. Si la fonction réelle gx : u ++ Efe“*] est 
définie dans un voisinage ouvert de l’origine, on appelle fonction génératrice 
des moments de X la fonction gx. Dans un voisinage ouvert de l’origine, on 
à alors : 


t #2 Fu 
gx(t) =1 +EXS +E; +. +EX]— +. 


La fonction caractéristique px(t) de X est définie par : wx(t) :— Ele“*]. Si 
X et Ÿ sont deux variables aléatoires indépendantes, on a alors : wx4y(t) = 
gpx(t}py(t}. Si E[{X|] est finie, alors x est continûment dérivable et l’on 
a : ÿx(0) = &E[X]. Enfin, si deux variables aléatoires ont même fonction 
caractéristique, elles ont même loi de probabilité. 

Voir [FF1], chap. 13. 


18 LOIS NORMALES ET EXPONENTIELLES, LOI GAMMA 


Une variable aléatoire, de densité 


1 e 2 (xER) 


est dite normale (centrée, réduite). La loi de cette variable est appelée loi 
normale réduite; elle est notée N(0,1). 


6 1e Notations utilisées et Rappels 


La loi normale N(y, 6), où u est un nombre réel et & un nombre strictement 
positif, est la loi de densité 


75 exp(-5 {e =) (&EeR). 


Une variable aléatoire X, dont la loi de probabilité est la loi normale N(4, 0) 
est d'espérance mathématique E[X] = y et de variance Var X = o?. 

Soient n > 1et tX = (X1,...,XA) un vecteur aléatoire, dont les com- 
posantes X; ont des moments du second ordre. (On note X le vecteur-colonne 
transposé de tX.} Le nombre Cov(Xi, X;) := Ef(X; — E[X:])(X; — E[X;]}] 
est la covariance de X; et X;, si à  j et la variance, encore notée Var X;, 
sii= j. La matrice T = (Cov(X;, X;)) (1 < i,5 < n) est appelée matrice 
des variances-covariances. On dit qu'un vecteur aléatoire tX = (X:1,...,X,) 
suit la loi normale centrée N'{0,F), s'il admet pour fonction génératrice 
gx(u) = exp(} turu), où tu := (a, un). Soit tu = (un, , Un) un vecteur 
de R°. On dit que X suit la loi normale W{u,T), si X — y suit la loi W(0,F). 
Si l'est une matrice régulière, alors le vecteur X admet la densité 


fx(e) = Par ep(-5 = a)E (x #)), 


oùfx:= (r1,...,%n). Lorque n = 1, on utilise les deux notations N(0,0) et 
N(0, 2), pour la loi normale centrée, d'écart-type s (et donc de variance a?). 

Soit À un nombre strictement positif; une variable aléatoire X à valeurs 
dans ]0,+co[ est dite exponentielle de paramètre À si elle est absolument 
continue et admet pour densité 

A _ faer*Æ, six>0; 
f(x) = {à sinon. 

La loi de densité f est appelée loi exponentielle de paramètre À (À > 0) et est 
notée £(A). Sa fonction de survie vaut r(x) = e* (x > 0). 

Une variable aléatoire est dite suivre la los l'(p, À) (gamma de paramètres 
p > 0, À > 0} si elle est absolument continue et admet pour densité : 


À de 1 
= <E Ar), six>0; 
1@)= { Te 
0, sinon. 
La somme de n variables aléatoires indépendantes, suivant chacune une loi 
exponentielle de paramètre À, suit une loi F'{n, À). 
Voir [FF1}, chap. 14, chap. 12. 


19 CONVERGENCES 


Soit (XA) une suite de variables aléatoires réelles définies sur un espace 
probabilisé (Q, 9, P). On désigne par (FA) la suite des fonctions de répartition 
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correspondantes. Soit X une variable aléatoire réelle, définie sur le même 
espace, de fonction de répartition F. On dit que la suite (X}) converge en loi 
vers X et l'on écrit XA L, x, si Fa(x) — F(x) en tout point de continuité 
de F. 

On dit que la suite converge en probabilité vers X et l’on écrit Xn + X, si, 
pour toute > 0,ona:lim, P{|X,-—X} > €} = 0. On dit que la suite converge 
presque sûrement vers X et l’on écrit X» 78 x, si P{lim, Xn = X}= 1. La 
convergence presque sûre entraîne la convergence en probabilité, qui elle-même 
entraîne la convergence en loi. 

Voir [FF1], chap. 16. 


110 LOIS DES GRANDS NOMBRES 


Soit (X») une suite de variables aléatoires, centrées, définies sur le même 
espace probabilisé. On dit que la suite (XA) satisfait la loi faible des grands 
nombres si la suite de terme général (1/n) 1 Xx converge vers 0 en 
probabilité. La suite (X2) satisfait la loi forte des grands nombres si la suite 
de terme général (1/n) 5£_, Xx converge vers 0 presque sûrement. 

Soit (XA) une suite de variables aléatoires, centrées, indépendantes deux à 
deux (resp. mutuellement indépendantes) et identiquement distribuées. Alors 
la suite (X,) satisfait la loi faible des grands nombres (resp. la loi forte des 
grands nombres). 

Soit (4:) une suite d'évènements. Le lemme de Borel-Cantelli affirme que 
si la série de terme général P(A4) est convergente, alors P(limsup, A4) = 0. 
Si les évènements À, sont indépendants deux à deux et si la série de terme 
général P(4,) est divergente, alors P(limsup,, 4) = 1. 

Voir [FF1}, chap. 17. 


1.11 LE THÉORÈME « CENTRAL LIMIT » 


Soit (X,) une suite de variables aléatoires indépendantes, équidistribuées 
ayant un moment du second ordre. On pose n := E[X;], 0°? := Var X1 et 
Me (Mi u)+e.+(Xn - n))/(o1n). Le théorème { central limit » affirme 
alors que la suite (YA) converge en loi vers une variable aléatoire normale 
centrée réduite. 

Voir FF1}, chap. 18. 


112 TRIBU ENGENDRÉE PAR DES VARIABLES ALÉATOIRES 


Soit Y une variable aléatoire à n dimensions, définie sur un espace probabilisé 
(@,%,P). La tribu Z(Y), engendrée par Y, est définie comme étant l’image 
réciproque Y—!(B*) de la tribu borélienne B°. C’est aussi la tribu engendrée 


8 1e Notations utilisées et Rappels 


par les évènements de la forme {Y € B}, où B € B". C’est encore la plus 
petite tribu, contenue dans %, qui rend Y mesurable (cf. [FF1], chap. 5, $7). 

Soit g une fonction réelle définie sur (. La proposition suivante fournit une 
condition nécessaire et suffisante pour que g soit mesurable par rapport au 
couple (A, E(Y)) c'est-à-dire pour qu'elle satisfasse : g”1(B1) € &(Y). 
Proposition 1.12.1. Conservons les mêmes notations que ci-dessus. Alors la 
fonction g est mesurable par rapport au couple (Q,&(Y)) si et seulement s'il 
existe une fonction mesurable f de (R°,B") dans (R, B!) telle que g = foY. 
En particulier, l’indicatrice LA d’un évènement À qui appartient à T(Y) est 
de la forme foY. 

Démonstration. D'abord, si g = f o Ÿ, pour tout B € B!, on à g”!(B) = 
Y=1(f-{B)). Comme f-1(B) € B”, on à bien g'(B) € Y=1(8") = &(Y). 

Pour la réciproque, on utilise le schéma traditionnel, (cf. [FF1], chap. 10, 
$5) pour établir de telles propriétés. On vérifie la propriété pour les variables 
aléatoires simples et positives, puis pour les variables aléatoires positives, enfin 
pour les variables aléatoires quelconques. 

Si g est une variable aléatoire réelle par rapport au couple (Q,T(Y)), à 
tout B € Bl correspond un € € B" tel que g7!(B) = Y-1(C). Soit g = 

ZX zærla, une variable aléatoire simple positive par rapport à (N,T(Y))}, 
1SkEm 
telle que {A1,..., An} soit une partition de { en éléments de 9. Il lui 
correspond une partition {C1,...,Cm} de Y({) telle que, pour tout & = 
1,2,...,m, on ait C4 € B° et g7!l({xx}) = Àx = Y-l(Cy). On pose alors 

Z rie, On a bien g = foY; de plus, f(y) = 0 pour tout 
1<REm 
yER"\Y(Q). 

Si g est une variable aléatoire positive, alors g = sup, 9n, où (gn} est une 
suite croissante de variables aléatoires simples positives (ef {FF1], chap. 10, 
Lemme 5.4.1). Pour chaque n#, on peut écrire gx = fn o Y, où f, est une 
variable aléatoire simple positive, nulle sur Y(N)‘; de plus, la suite (f,) est 
croissante. Alors f := sup, f, est une variable aléatoire positive et g = foY. 
Si, enfin, g est quelconque, on détermine deux variables aléatoires positives f1 
et fa telles que g* = fioŸ et g7 = foY etona:g=(f-/frjoY. 


Si (#;) (à € T) est une famille de variables aléatoires réelles définies sur 
le même espace probabilisé (Q,%, P), on définit la tribu engendrée par cette 
famille comme étant la tribu, notée T((K;) (i € 7)), qui est engendrée par la 
classe des évènements de la forme {V. € B},oùielet BE Bi. 

Lorsque l’ensemble Z des indices est fini et que les variables Y; prennent 
leurs valeurs dans N, les éléments de la tribu engendrée par la famille ont une 
forme explicite, comme établi dans la proposition suivante. 


Proposition 1.12.2. Soient I = {ii < --. < x} un sous-ensemble fini de N 
et (Y;) (à € D) une famille de variables aléatoires à valeurs entières, indicée 
par TI. Soit C la classe des évènements de la forme 


Pa sb. Ya = be}, 
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où les b; sont des entiers. Alors, les éléments de la tribu T((Y:) (4 € D)), 
engendrée par cette famille, sont aussi les réunions dénombrables d'éléments 
dec. 


Démonstration. En effet, la tribu T((Y:) (4 € 1)) est engendrée par les 
évènements {Y; = b}, où à € I et b € N, donc aussi par les éléments de C. 
Soit © l’ensemble des réunions dénombrables d'éléments de €. Naturellement 
TC (M) (à € T)). H suffit donc de vérifier que © est aussi une tribu. Or, ceci 
résulte immédiatement du fait que les éléments de € forment une partition 
dénombrable de l’ensemble ©. [] 


1.13 ESPÉRANCES CONDITIONNELLES 


Supposons que Y = (Y0,..., YA) est un vecteur aléatoire à (n + 1) dimensions 
et X une variable aléatoire réelle, tous deux définis sur le même espace 
probabilisé (Q, 4, P). Formons le vecteur aléatoire (X, Y}, à (r+2) dimensions 
et supposons que celui-ci a une densité de probabilité f(x, y), où x € R et 
y € R°+1, On peut alors déterminer la densité du vecteur Ÿ par intégration : 


F= f Haudr. 


Considérant une densité arbitraire go(x) sur R, on définit la densité condi- 
tionnelle de X à {Y = y} comme étant la fonction réelle fx|(-|y), définie 
pour tout réel x par : 


CEE . 
Haven = FAO si y est tel que fy{y) > 0; 
go(x), sinon. 


Ensuite, si l'intégrale fe x fx |v (x |y) dx est absolument convergente, on pose 


ExlY=ue [otre 


et on appelle cette intégrale l'espérance mathématique de la variable aléatoire 
X conditionnelle à {Y = y}. Pour tout y € R°Ÿ!, posons : 
e(y) := E[X |Y = y]. 

Soit Py la loi de probabilité du vecteur Y. La fonction e, qui apparaît 
dans le diagramme suivant, est une variable aléatoire définie sur l'espace 
probabilisé (R*+1,8%T1, P;-). La fonction composée coY est alors une variable 
aléatoire définie sur ({,%,P). On la note E[X | Y] et on l'appelle l'espérance 
mathématique conditionnelle de X en Y. 


16 1e Notations utilisées et Rappels 


ap) EXT, 


FN LE 


C'AENER 22) 


(R, 8") 


Considérons maintenant une fonction k de (n +2) variables réelles. Pour 
tout y € R"*!, on peut considérer l'intégrale fn k(x,y) fx1y(xly) de. Si elle 
est absolument convergente, on la pose égale à 


Eho(KY)IY = ne Jen) frire lo de 


et on l'appelle l'espérance mathématique de ho (X,Y) conditionnelle à 
{Y = y}. Notons encore e la fonction € : y ++ Elko(X,Y)|Y = y]. C’est 
un vecteur aléatoire défini sur l'espace (R"+1,8%+#i P;-). Notons pro la pro- 
jection pro : (x,y} — y. On définit l'espérance mathématique conditionnelle 
de ho(X,Y) en Ÿ comme étant la variable aléatoire, notée E[h 0 (X,Y)|Y], 
définie par le diagramme : 


(RAP) __ Efho(X,F)1Y] (RE!) 
APN r LE 
(Re+2, gr, Por} (Re, 8"+1,Py) 


Pour des raisons typographiques, on pose aussi Ey[X] := E[X }Y]. Nous 
rassemblons ci-dessous quelques propriétés importantes de l'espérance condi- 
tionnelle. Nous leur donnons le nom de Règles pour mettre en évidence leur 
caractère opératoire. Les symboles f, g, k, ... qui y figurent, désignent des 
fonctions mesurables dont les arguments sont en évidence de par l'écriture. 


Règle 1. Si X et Y sont indépendantes, alors E[g o X |Y] = Elgo X}. En 
particulier, si go X := X, on obtient E[X |[Y] = E[X]. 

Règle 2. On a : EfhoY|Y] = hoY. En particulier, en prenant ho Y — 
E[X |Y], on obtient : Ey[Ey{X]] = Ev{X], ce qui signifie que l'opérateur Ey 
est idempotent. 

Règle 3. L'opérateur Ey est linéaire : Ey[X1 + X2] = Ey[X1} + Ey[Xo] et 
EyfcX] = cEy[X]. 

Règle 4. On a : El(go X)(hoY)|[Y]=(hoY)Efgo X|Y]. Autrement dit, 


dans le calcul de l'espérance mathématique conditionnelle en Y, une fonction 
de Y seul se comporte comme une constante. 


Règle 5. On a : E[E[uo(X,Y)|Y]] = Efuo{X,Y)]. Autrement dû, l'espérance 
de l’espérance conditionnelle est égale à l'espérance. 
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Notons trois cas particuliers. En prenant u(x, y) := g{æ)h(y), on obtient : 
Ej(geX)(hoY)] = E[Ef(ge X)(hoY) | Y1], qui est égal à Ehoÿ) ElgoX |YIL 
d’après la Règle 4. On à ainsi : 


Eh o Y}E[( 0 X)[Y]] =Elgo X)h 0 Y)]. (118.1) 
Prenons maintenant u{x,y) := g(x). Alors 
EE ° X) | Y1] = El o X]. (113.2) 


Prenons, enfin, u(x,y) := g(x) = 1_wy(r), de sorte que Ejg o À} = 
Ja(x) dPx(x) = P{X <t}. Par ailleurs, 


EEpox (ve {,EboX1Y = yjdPr(u) 


= Elf{xe 1Y = v]dPr(y) 


nt 
= [PE < er = 0) ds (). 
On a donc la formule : 
P{X<#} =[ L PAX SET = u}dPr (y). (113.3) 
Rn 


Toutes ces formules sont démontrées dans [FFi], chap. 12, $4, dans le 
cas où les variables sont absolument continues, la variable Ÿ pouvant être 
à une ou plusieurs dimensions et s’appliquent, presque ne varietur, dans le 
cas où Ÿ est à plusieurs dimensions. Nous nous dispensons donc de faire 
de nouvelles démonstrations. En revanche, nous établissons l’extension de la 
formule (1.13.2), au cas où l'opérateur E est remplacé par l'opérateur Ez, où 
Z est une nouvelle variable aléatoire. Dans cette extension, on suppose connue 
la loi du triplet (X,Y, Z). 


Règle 6. On a 
EzlEz{{g o X}|Y]] = Ezfg o X], (1134) 
une identité qui doit se comprendre comme 
EEe,2{(@ ° X)] = Ezfg o X], (-18.5) 
ou bien encore comme 
ElEl(a ° X)1(Y,2)]12] = El(go X)121. (113.6) 


Démonstration. Faisons la démonstration dans le cas où les variables sont 
absolument continues. Par définition de l'espérance conditionnelle, on à : 
Ef(g o X)1(Y,2)] = «1 o (F2), avec e(y,2) = [a(x) fx] 2x (v,2)) de. 
Puis, EfEl(g o X)1(Y,2)171 = Eles o (F,2)12] = ee Z, avec e(z) = 
J'eaty, 2) fviz(ule) dy = ff (x) frximn(e (2) friz(ule) dx dy. 
Cette dernière intégrale vaut : 

fera u,2) font?) 

[fat rare ae 


lead 2) de du 
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2 romnteneay)ar = | D ram 2 dr 


= fo DES de 2 fat frire tode 


D'autre part, E{(, na = 63 0 Z avec es(z) = f g(x) fxiz(æ|z) de. On a 
donc es(z) = es(z) ct par conséquent l'identité {1.13.6) est vérifiée. [ 


Reprenons la formule donnant l'espérance mathématique de k o (X,Y) 
conditionnelle à {Y = y}, en supposant que X et Y sont des vecteurs 
aléatoires, disons à valeurs dans RP et R?. Naturellement, la fonction À reste 
une fonction réelle. La densité fx; (x|y) se définit de façon analogue et 
l'on a fxir(x|y) = fx(x) en tous les y où fy(y) > 0, lorsque X et Y sont 
indépendants. Supposons cette dernière condition satisfaite et aussi fy(y) > 0 
en tout y. Alors 


or = ue [he frite de = [heu fxtr)de, 
soit 
Efho(X,Y)|Y = y] = E[A(X, y). (113.7) 


Prenons p = q et soient B;,... , B, des boréliens de la droite. Notons 
X,..., Xp et Y1,...,Ÿ, les composantes des vecteurs aléatoires X et Y. Alors 


P 
PLAL(X: + Yi) € B}]Y = y} = EU Y= 
LAC it) FIY = y} =Ef hrccsrocso | 4l 
Li 


p p 
= EU LoxavesziY = y = EL Ip, 0 (Xi+Y)|Y = y] 
= = 
=Eho(X,Y)IY=y= Elo Cu, 
en prenant pour À la fonction k(z,y) := ut Ip,(@i +w). Si donc X et Y sont 
indépendants, on à la formule : 
P 
PAIX +Y)eB}IY =y}= PO + ui) € Bi}}. (1138) 
= = 
Ainsi, la loi conditionnelle de X + Y, conditionnelle à {Y = y}, se déduit de 
celle de X par une simple translation. 


Remarque. Toutes ces formules, qui ont été démontrées dans le cas absolument 
continu, sont encore valables dans le cas général. Notons, enfin, que les 
formules qui comportent des espérances conditionnelles ne sont vraies que 
presque sûrement. 


Conservons les mêmes notations pour X et Y. Nous donnons un critère pour 
qu’une variable aléatoire réelle Z soit égale, presque sûrement, à l'espérance 
conditionnnelle E{X |Y]. 
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Proposition 1.13.1. Soient X et Z deux variables aléatoires réelles et YŸ une 
variable aléatoire à (n + 1) dimensions, toutes définies sur un même espace 
probabilisé (Q,4,P). Supposons que Z soit de plus mesurable par rapport à 
(Q,T(F)). Alors Z = E{X | Y} presque sûrement, si et seulement si pour tout 
évènement À € T(Y) on a : E[fa Z] = Ella X]. 
Démonstration. En effet, si cette dernière condition est vérifiée, on à : 
Effa 2] = Elfa X] = E[E(A E[X |Ÿ]]} = Ella E[X|Y1}, d'où 
El(Z - EX) = 0. 
Comme Z et E[X |Y] sont toutes deux des variables aléatoires par rapport 
à (Q,T(Y)}, on peut prendre À := {Z — E[X|[Y] > 0}. Il en résulte que 
Ef(Za(Z — E[XIY])t} = 0, ce qui implique (Z — É[X |Y])* = 0 ps. De la 
même façon, (Z —E[X |Y])" = 0 p.s. et donc Z = E[X|Y] ps. 
Réciproquement, cette dernière propriété entraîne que, pour tout À € T{Y), 
on a : Ef4Z] = EZAE[X | Y]) = ElEUAX|Y]] = EflAX]. O 


Chapitre 2 


Temps d’arrêt 


La notion de temps d'arrêt intervient de façon essentielle dans l’étude des pro- 
cessus stochastiques. Nous donnons ici les principaux résultats les concernant, 
du moins pour les temps d'arrêt à valeurs entières. 


2.1 GÉNÉRALITÉS SUR LES PROCESSUS STOCHASTIQUES 


Sous le nom de processus stochastique, on entend un modèle permettant 
d’étudier un phénomène aléatoire évoluant au cours du temps. Pour le décrire, 
on suppose donnés : 

(1) un espace probabilisé (Q,%, P); 

2) un espace mesurable (E,B), où E est appelé ensemble des états (du 
processus); 

(3) une famille (Y:}ser de variables aléatoires définies sur (0,2, P) à valeurs 
dans E. 


L'ensemble T des indices est l’espace des temps. Pour w € QetteT la 
quantité Y;(w) est appelée état du processus à l'instant t. Étant donné w € (, 
VPapplication qui à tout & dans T fait correspondre Y,{w}, l'état du processus 
à l'instant t, est appelée la érajectoire de w. Lorsque E et T sont discrets, 
toute trajectoire est constituée par une suite de points dans le plan, comme 
représenté dans la Figure 2.1. 

On distingue plusieurs types de processus suivant que T'et E sont discrets 
ou continus. Si T C N, on dit que le processus est à temps discret. Si T = [0,1] 


16 2e Temps d'arrêt 


E=N | x 


x 
x 
x x 
X x 


L + L + T = 
ot ot T'=N 


FIGURE 2.1 


où R, on dit que le processus est à temps continu. Suivant que E est fini, 
dénombrable ou continu, on dit que le processus a un nombre fini d'états, a 
un espace d'états dénombrable, a un espace d'états continu. 

Lorsque T = N (temps discret), le processus stochastique est décrit par une 
suite Yo, V1, Ya, .… de variables aléatoires à valeurs dans (E, B). Si E est fini ou 
dénombrable, ces variables aléatoires sont forcément des variables aléatoires 
discrètes. 


Considérons un processus à temps discret, ou encore une suite de variables 
aléatoires (Y,} (n > 0). Pour matérialiser la connaissance du processus 
jusqu’à un instant n, on introduit la tribu des évènements se produisant 
jusqu'à l'instant n (inclus), comme étant la tribu engendrée par le vecteur 
(Y6:...,Yh). On la note Yon où, plus simplement, 4,. Elle est donc engendrée 
par les évènements de la forme {Y; € B}, où B € B! et où à € {0,1,...,n} 
(cf. 81.12). 


On pose A_1 = {9,0}. La suite (A,) de ces tribus est monotone croissante : 
H1CHCMHCHEC... (2.1.1) 


Proposition 2.1.1. Si les variables aléatoires Y, sont à valeurs entières, ou 
encore si l’espace des états E est N, chaque évènement À € An, est réunion 
dénombrable d'évènements de la forme 


= ho," = bd, ee bn} 
où les b; sont des éléments de E. 


Démonstration. Ceci résulte immédiatement de la Proposition 1.12.2 et de la 
définition même de la tribu 4. [] 


Si m,n sont deux entiers tels que m < n, on désigne par Ana la tribu 
engendrée par le vecteur (Y,...,Y,) et par 4, la tribu engendrée par la 
famille (Y;) (> n). 
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2.2 NOTION DE TEMPS D'ARRÊT 


Considérons une suite de parties indépendantes de pile {« p») ou face («£»), la 
probabilité d'apparition de (p> étant EE Convenons qu'un joueur, engagé dans 
cette suite de parties, gagne ou perd 1 euro selon que pile ou face apparaît et 
désignons par Y,, le gain de ce joueur à la n° partie. La suite (Y:) (n > 1) de 
ces gains est une suite de variables aléatoires, indépendantes et identiquement. 
distribuées, de loi commune ei + ei). Posons X, := Vi +: +, une 
valeur qui n’est autre que le gain total du joueur après la nième partie. Pour 
tout n > 1, on a E[X,] = 0, ce qui s'exprime en disant que le jeu est équitable. 

Or, le joueur n’est pas obligé de jouer indéfiniment, ni même de s'arrêter à 
un instant donné féré à l’avance. Ii peut, au contraire, adopter une strafégie 
d’arrêtet décider d'arrêter le jeu à un instant qu'il juge favorable, par exemple 
à l'instant où il mène pour la première fois. Désignons par T l’instant où le 
joueur décide de s'arrêter. Cet instant T est une variable aléatoire à valeurs 
dans NU {+00}, définie sur le même espace probabilisé que la suite (Y}) 
(r > 1}. Si T est presque sûrement à valeurs finies, le gain du joueur à la 
date T peut alors s’écrire : 


Xr= te +Yr. 


La question à se poser est la suivante : a-t-on encore E[X7] = 0? Donnons 
déjà quelques réponses partielles : 

(1) si T = n fixé, on a bien E[X;] = 0. 

(2) si T est une variable aléatoire à valeurs dans {1,2,... }, indépendante 
de la suite (YA) (n > 1) et si EÏT] < +0, l'identité de Wald (cf., par exemple, 
{FF1], chap. 9, Exercice 6) permet d'écrire : 


E[Xr] = EM +++ Yr] = EE[M] = 0. 


Que peut-on dire pour d’autres instants aléatoires T'? Nous allons voir qu’en 
imposant à T des conditions relativement naturelles et simples, cette propriété 
de jeu équitable est conservée. Nous sommes ainsi conduits à la notion de 
temps d’arrêt. 


Définition 2.2.1. Soit (Y,) (r > 0) une suite de variables aléatoires, définies 
sur un même espace probabilisé (Q,21, P) (donc un processus stochastique à 
temps discret). Soit T une variable aléatoire définie sur le même espace. On 
dit que T'est un temps d’arrêt (ou de Markov), adapté à la suîte (Ya) (n > 0) 
{on dit encore : un éemps d'arrêt du processus (Ya)), si 

(a) la variable aléatoire T prend ses valeurs dans NU {+co}; 

(b} pour tout n > 0 l'évènement {T = n} appartient à la tribu A4 = 
EP... Yn)- 


La condition (b) postule qu’à la date n, on ne peut décider de la réalisation 
ou de la non-réalisation de l'évènement {T = n} qu’à partir de l’information 
fournie par le vecteur (Yo,..., YA). En d’autres termes, l'évènement {T = n} 
ne dépend pas de (Yh41, Va+2,...), c'est-à-dire de l'histoire du processus après 
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la date n. Dans l'exemple donné précédemment, cette condition empêche toute 
prévision de la part du joueur {pas de délit d’initié!). 

Un énoncé équivalent à celui de la condition (b} est de dire que pour tout 
n > 0 l’indicatrice L{r_,} de l'évènement {T = n} est une fonction mesurable 
du vecteur (Y9,...,Ÿà) (cf. Proposition 1.12.1). 


Remarque. Dans la définition d’un temps d’arrêt, la condition (b} n'implique 
pas nécessairement que l’on ait E[X7] = 0. Reprenons le même exemple (Y,} 
{n > 1) d’une suite de parties de pile ou face et définissons 
T:=minfgn: Xn=V+e+Y=i} 

D'abord, T est bien un temps d’arrêt adapté à (YA), car pour tout n > lona: 
{T=n}=M<iM+el.. Mike + Van <LMi+e += 1} 
ce qui montre que l'évènement {T = n} appartient à la tribu T(Yo,...,Yn}. 
Ensuite, puisque Xr = 1, on à E[X7] = 1 > 0. Si l'on avait E[T] < +00, 
alors, d’après l'identité de Wald généralisée (ef. $2.5), on aurait E[X7] = 
E[TJE[M:] = 0, d’où une contradiction. Il en résulte que E[T] = +co. Par 
conséquent, si l’on adoptait cette stratégie pour arrêter le jeu, on serait 
amené, en moyenne, à jouer des parties fort longues, pouvant occasionner 
des découverts importants ! 


Donnons quelques propriétés des temps d'arrêt. 


Proposition 2.2.1. On peut remplacer la condition (b} de la définition d'un 
temps d'arrêt par l’une des conditions suivantes : 
(br) pour tout n > 0 l'évènement {T < n} appartient à la tribu %, ; 

(b”) pour tout n > 0 l'évènement {T > n} appartient à la tribu An. 
Démonstration. Il suffit de démontrer (b’). D'une part, {T < n} = {T = 
0}+-..+{T = n}, d'autre part, {T = n} = {T <n}\{T <n-l};c 
qui permet de conclure puisque la suite des tribus %, est croissante, d’après 


(221). 0 


Proposition 2.2.2. Si T est un temps d'arrêt du processus (YA), alors les 
évènements {T <n} et {T > n} appartiennent à An_1. 
Démonstration. Ce résultat découle immédiatement de la Proposition 2.2.1. [|] 


Remarque. Si, pour tout n > 0, l'évènement {T < n} (ou l'évènement 
{T > n}) appartient à A}, alors T n’est pas nécessairement un temps d'arrêt. 
On peut voir, tout d’abord, que l’argument utilisé dans la démonstration de la 
Proposition 2.2.1 échoue, puisque l'identité {T =n} = {T <n+1}\{T<n} 
permet simplement de conclure que {T = #} est dans 4341. Pour établir 
pleinement cette remarque, nous fournissons un contre-exemple issu de la 
théorie des processus de Poisson {cf. chap. 3 et 4). 


Contre-exemple. Dans un processus de Poisson, on a une suite croissante 
d’instants (SA) (n > 1) où se produit un évènement privilégié, qu’on appelle 
&top» (empruntant la terminologie des émissions radio-actives). On désigne 
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par N(t) le nombre de tops se produisant dans l'intervalle [0,#]. On peut 
interpréter N(t) comme l'indice du dernier top se produisant dans [0,4]. En 
posant S5 = 0 on peut écrire : 
{NO=n}= {Sn <t, Suyi > t}. 

On voit ainsi que pour décider de la réalisation de l'évènement {N(+) = n}, il 
faut connaître les valeurs de 5, et de Sh41. Par conséquent N{t) n’est pas un 
temps d’arrêt adapté aux $,. Pourtant, l'évènement {N(t) > n} appartient 
à T(S1,...,8n), puisque {N(4) > n} = {S, < t}. I en est de même du 
complémentaire {N(t) < n}. En revanche, N{t}+1 est un temps d'arrêt adapté 
aux S,, puisque {N(t)+1=n}={Nft}=n-1}= {Sn 1 <t,8, >t} On 
peut interpréter N(+t) + 1 comme l'indice du premier top se produisant dans 
Hé, +oel. 

Ce contre-exemple montre, en particulier, que si T est un temps d'arrêt, 
la variable aléatoire (T — 1) n’en est pas nécessairement un. En revanche, la 
variable (T + &), avec & > 0 en est un. (Voir Proposition 2.2.3 ci-après.) 


Proposition 2.2.3, La variable aléatoire constante T = k (k entier positif) 
est un temps d'arrêt. Si T est un temps d'arrêt et k un entier positif, alors 
T+k est aussi un temps d'arrêt. 
Démonstration. Posons T” := k. Alors {T' = n} est l'évènement certain ou 
l'évènement impossible, suivant que n = k ou n Z k, deux évènements qui 
sont trivialement dans {,. 

Par ailleurs, {T +kæ=n}={T=n-—k}, qui est l'évènement impossible si 
n < k et qui appartient à %,_4 et donc aussi à 4,, sin >k. [] 


2.3 AUTRES PROPRIÉTÉS DES TEMPS D'ARRÊT 


L'algèbre des temps d'arrêt est peu riche. Notons toutefois les propriétés 
suivantes. 


Proposition 2.3.1. Soient S et T deux temps d'arrêt du processus (Y,). Alors, 
S+T, SAT et SVT sont aussi des temps d'arrêt. En particulier, T A k est 
un temps d'arrêt borné. 

Démonstration. En effet, pour tout n >0,ona{S+T=n)}= U {S= 

o<k£n 

KHT =n-k}, qui appartient à A}, puisque chacun des termes y appartient. 
De même, {SAT >n}={$S > n}N{T > net [SVT <n}={s< 
n}N{T <n}. On peut alors conclure à l’aide de la Proposition 2.2.1. {] 


Remarque. Soient $, T deux temps d’arrêt tels que $ < T. Alors U:=T-—S 
n'est pas nécessairement un temps d'arrêt. 

Pour le voir, reprenons le contre-exemple du processus de Poisson (W(t)) 
donné dans le paragraphe précédent, avec la suite croissante (5,) des appari- 
tions des tops. D'abord $ := 1 est un temps d'arrêt, également T':= N(t)+1, 
mais, comme on à vu, Ü : — 8 = N{t} n'est pas un temps d'arrêt. 
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Revenons au cas général d’un processus (Y,) (n > 0) et d’un temps d'arrêt T 
de ce processus, que nous supposons à valeurs finies. On a défini la tribu 
A, = T(Yo,...,Yn). Comment définir la tribu Ar des évènemens survenant 
jusqu'au temps d'arrêt T (inclus)? 


Proposition 2.3.2. L'ensemble noté r des évènements À € À ayant la 
propriété que, pour tout n > O, l'intersection AN{T = n} appartient à A, est 
une tribu. 

Démonstration. D'abord, QN{T = n} = {T = n}, qui appartient à A, 
puisque Test un temps d'arrêt, d'où ( € Ar. Ensuite, soit (4) une suite 
d'éléments de Ar; comme Ù,, Am N{T = n} = Am N{T = n})}, on voit 
que la réunion de ces évènements appartient à %,, puisque chaque terme y 
appartient. Enfin, considérons À € Yr. Alors A°N{T = n} est la différence 
propre {T =n}\(AN{T = n}) de deux évènements qui appartiennent à A, ; 
il appartient donc à A, et par suite A° € Ar. [] 


Proposition 2.3.3. Soient S et T deur temps d'arrêt. Alors 
S<T— Us C Ar. 


Démonstration. Prenons À € As. Comme S < T, on peut écrire 
ANÎT=n}= [J AN(S=AN{T=n}. 
O<k<n 
Or, pour 0 < k < n, l'évènement AN{S = k} est dans Az, donc aussi dans %, ; 
la réunion est donc aussi dans 4. [] 


Supposons T à valeurs finies. Pour chaque épreuve w la quantité Yrçu)(w) 
est un certain état (élément de E). L'application Yr envoyant w sur Yr((w) 
est appelée état du processus à l'instant T. 


Proposition 2.3.4. Soit T un temps d'arrêt du processus (Yh) (n > 0). 
L'application Yr est une variable aléatoire {par rapport à (Q,4)). De plus, 
T'et Yr sont aussi des variables aléatoires par rapport à (Q, Ur). 
Démonstration. En effet, si B appartient à la tribu définie sur l’ensemble £ 
des états, on a : 


(reB}= (U{T=RYEB}= [U{T=RAMEB}. 
#>0 K>0 
Chacun des évènements de cette réunion appartient à la tribu 4, donc aussi 
la réunion. Pour démontrer que T' est une variable aléatoire par rapport à 
(Q, %r), il suffit de démontrer que, pour tout entier & > 0, on a {T = k} € Ar, 
ou encore que, pout tout n > 0, on a {T = K}N{T = n} € A. Or 
{T = k}N{T = n} est vide, si & # n ou vaut {T = n}, si & = n. Il est 
donc bien dans {,. 
De même, {Yr € B} appartient à Yr, si et seulement si, pour tout n > 0, 
l'évènement {Yr € B}N{T = n} appartient à A. Or, cet évènement peut se 
récrire {Yn € B,T = n}, qui est bien dans 4. [ 
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2.4 PROCESSUS DE VARIABLES INDÉPENDANTES 


Illustrons l'utilité de cette notion de temps d’arrêt dans l’étude des processus 
de variables indépendantes. Considérons un processus (Q,9,P,(Y:},E), où 
ÆE = N ou une partie finie de N et où les variables aléatoires Y, sont 
mutuellement indépendantes. Pour chaque n > 0 soit Q, la loi de Y,. Pour 
toute suite (bn, ,bn+1} d'éléments de Æ, on a donc 


P{Vo = Dos Vas = bnan} = P{Yo = bo} P{Yapnæ= nn}. (241) 


Lemme 2.4.1. Soit À un évènement appartenant à %. Alors pour tout 
Brnh CE ona: 


P{A Papi € Bari} = P(A)Qn+i(Bnt1) = P(A)P {Ya € Bnui}. 


Démonstration, D'après la Proposition 2.1.1, chaque évènement À € 9, est 

réunion dénombrable d'évènements de la forme {1 = b1,...,Yh = b}. 

On écrit symboliquement À = 3 {Yi = b1,...,Yn = bn}. L'évènement 
LEE 

{Vrai € Ba} est aussi réunion dénombrable d'évènements de la forme 

{nai = bny1}. D'après (2.4.1), on peut donc écrire, les sommations 


P{A Your € Bauh= Y P{Mi=b.., Ya = bn, Yagi © nu} 


bsdn bn +1 

= D PM = bn = Pau = bou} 
bbnobntt 

=D Pi bi Ve = ba} DD Pau = bou) 
binbn Bi 


= P(A)P{Yan € Ban}. D 


Dans le théorème suivant, on suppose que la suite (Y,) (n > 0) est formée 
de variables aléatoires, indépendantes et de même loi. Leur loi commune est 
notée Q. On démontre que le résultat précédent est encore valable, si l’on 
remplace la suite des instants fixés par une suite strictement croissante de 
temps d'arrêt. 


Théorème 2.4.2 (Théorème des temps d'arrêt de Doob). Soit (T,}1>1 une 
suite strictement croissante de temps d'arrêt à valeurs finies, soit À un évène- 
ment appartenant à Ur, et soient Bi, ..…., B, des sous-ensembles de E. Alors 
on a la relation : 


P{A Yn41 € B..., rip € Br} = P(A)Q(B:1):--Q(Ba). 
Démonstration. En considérant le système complet d'évènements {{Tn = k}) 
(& > n —1), on peut obtenir la décomposition : 

{A Yniyi € Bi... Vrspi € Bn} 
= ND {A Ynu € Bin... Yrn € Bn,Tn = k} 


&>r—1 
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D {AY € Bi... Vin € Bn-1,Tn = k, Yan € Ba}. 
k>n—1 


Or, du fait que la suite des temps d'arrêt (Th) est strictement croissante, 


l'évènement {A,Yriy1 € Bi,..., Yi € Bn-1,Tn = k} est la réunion 
d'évènements de la forme 


{A YhnEB1,...,Vii41 € Bas Ti = ds, Ta = ün-1, Tn = KE}, 


où 0 Si < +. < ini < k. Comme À € An, on a: ANT = ü} € 
A, € A. Ensuite, {Yi,41 € Ba... , Vi 141 €Bni} € Liu © Uk. Enfin, 
{Die ü}e dt € Ua, , {Tai = ini} € M © Ur, ÜMn = k} € Ur, 
du fait que les T; sont des temps d'arrêt. Il en résulte que l’évènement 
{A, Yrit1 € Ba, Vrai € Bn-1: 7 = k} appartient à A+. On peut alors 
appliquer le Lemme 2.4.1 et écrire : 
P{A,Yni € Bi,..., Vr_ it € Bas, Ta = k, Yi4n € Ba} 
= P{A Yan € Bis... rs ini € Bai, Tn = k} P{Yky1 € Bn} 
= P{A, Yn4 € Bu... Yr,sqr € Bn1, Ta = k}Q(B) 


En sommant par rapport à k£, on en déduit : 
P{A, Yan € Bi, Vr it € Bar, Yrixi € Bn} 
D P{A, Pnau € BP... Yi € Bn-1, Ta = k} Q(Bn) 


k>n-1 
= P{A,Yn € Bi,..., ni € Bn-1} Q(Ba) 
D'où, par récurrence sur n, 
PA, Yn4 € Bi... Yni41 € Ba, Vroti € Ba} 
= PA Yan € Bi... Vnsti € Bn-2} Q(Ba-1) Q(B:). 


A)Q(B) -+-Q(Ba1)Q(Br). [l 


Conservons les mêmes notations que dans le précédent théorème. Pour 
chaque n > 1 et chaque & > 1, la suite (T1,...,Tn,Tn +1,7n +2,...,Tn +84) 
est encore une suite strictement croissante de temps d’arrêt. Dans l'identité 


P{A,Yn € Bi... rat € Br: Yrase € Bag... Vrutk € Bn+k=1} 
= P(4)Q(B1) +: Q(Ba)Q (Bari): Q(Bn+k-1), 
prenons À = {? et Bi =: = Bn_1 = E, on en déduit : 
Prin € Ba. Vite € Bnsk1} = Q(Bn) : Q(Bn+-1). 


Le processus (Yr,41,Yn+2,...) est donc encore un processus de variables 
indépendantes, de même loi. 
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2.5 IDENTITÉ DE WALD 


Pour terminer ce chapitre, établissons la généralisation suivante de l'identité 
classique de Wald. 

Théorème 2.5.1 (Identité de Wald). Soient (XA) (n > 1) une suite de varia- 
bles aléatoires indépendantes, identiquement distribuées, vérifiant EliX1|] < 
+oo et N un temps d'arrêt, à valeurs dans {1,2,...}, adapté à la suite (X:) 
{n > 1), d'espérance mathématique finie : E[N] < +oo. Alors 


N 
EL Xe] = EME]. 
nel 
Démonstration. On à d’abord l'identité évidente : 


N 
EXne D Xn inen) = Xi + DD Xn line}. (2.5.1) 
nel n>l n>2 
Ensuite, la Proposition 2.2.2 implique que, pour tout n > 2, l’indicatrice 
Linen) ne dépend que de (X1,..., Xn_1): elle est donc indépendante de X,; 
d'où ÉLXn Tneny) = EX] Elnen] = ELXIP{N > n}. Prenons alors 
l'espérance mathématique des deux membres de l'identité (2.5.1). On a 
formellement : 


ES Xe] =E[E Xulen] = X EXn nm 
n=l n2l n>l 
= EX) P{N > n}= ENJEUX]. 
a>l 


Pour justifier ce calcul formel, il suffit de montrer que la série de terme général 
EfiXnl l{neny] est convergente, Or, ceci est le cas, puisque : 


DEN Xal new) = DC ELXal] Etre} 
R>1 n>l 


=E{lXl] ) PIN > n} = E[JAITEIN] < +00. D 


n>l 
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2.6 COMPLÉMENTS ET EXERCICES 


2.1 Temps d'atteinte 

Soit À un sous-ensemble d'états et (YA) (n > 0) un processus. Le femps 

d'atteinte dans l’ensemble A du processus est défini par : 
Taï=inffn>0:Y € A}. 


Soit r un entier tel que r > 1. On définit To comme étant le premier 
instant où le processus (Yh) atteint le sous-ensemble À pour la r fois. 
Alors Ta = TO et TP {r > 2) sont des temps d’arrêt du processus (3). 


2.2 Soient (Y:) (nr > 0) un processus et À un sous-ensemble de ses états. 
Le dernier instant TA, où le processus (Ÿ,) est dans À, appartient à la tribu 
engendrée par la suite infinie (Yn,Yn41,...). 

Supposons donné un processus (Z:) (n > 0), de variables aléatoires 
indépendantes et de même loi, celle-ci étant donnée par ge_1+pex1 (p+q = 1). 
Pour chaque n > 0, on pose YA := Zo + --- + Z, et on note À l’ensemble des 
entiers négatifs ou nuls. Alors T', n’est pas un temps d'arrêt du processus (Y}) 
(nr > 0). 


2.3 On considère une suite infinie de parties indépendantes de «pile» ou 
{face}, la probabilité d'obtenir ‘« pile» étant p et celle d'obtenir « face» étant q 
{p+q = 1). On forme la suite (Y,) (n > 0) des variables aléatoires indicatrices 
de ces parties. La suite (Y:) est donc un processus de variables aléatoires 
indépendantes, de même loi, cette loi étant donnée par geo +pe1. Se reportant 
à l’Exercice 2.1, on pose À := {1} et on considère la suite des temps d'arrêt 
TO (r > 1). La loi de T4 = TU) est la loi géométrique et celle de TO? (r > 2) 
est la loi binomiale négative. 


2.4 On considère le processus (Ÿ,) (n > 0) décrit dans l'Exercice 2.3 et on 
définit : 
rl SY%=l 
13, si =0. 
Alors T est un temps d'arrêt. En revanche, si l’on pose 


1-2 SB=l; 
ref sic 


alors T’ n’est pas un temps d'arrêt. 


2.5 On considère, de nouveau, le processus (Z:) (n > 0) décrit dans 
l'Exercice 2.3, mais on suppose p = q = à Pour n > 0, on pose toujours 
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Yn = Zo + Z1 +: + Zn. On désigne par T le temps d'atteinte {voir Exer- 
cice 2.2) du processus (Y,) (n > 0) dans l’ensemble À = {1}. 

Établir P{T < 24, Va € 1} = P{T < 9h, Ya > 1}, puis P{T € 2k} = 
1 P{Ya = —1}. En déduire la fonction de répartition de T. 


2.6 Le collectionneur de vignettes 

Pierre achète des tablettes de chocolat d’une certaine marque. Dans chaque 
tablette, il trouve une vignette qu’il peut coller dans un album édité par cette 
marque. L'album contient m emplacements. Soit Ti := 1, puis T2 le premier 
instant après T1 où ii obtient une nouvelle vignette, puis T3 le premier instant 


après T2, où il obtient encore une nouvelle vignette, ... , T':= T,, l'instant où 
son album est achevé. On pose : WU := Ti = 1, Us = To — Ti, Us = T3 — D, 
Un = Tr — Tm_1. 
{a) Déterminer la loi du vecteur (U:,U2,..., Um). 
(b) Les variables aléatoires U1, Uo, ... , U;, sont indépendantes. 


{c) En déduire la fonction génératrice de T' et son espérance mathématique. 


2.7 Le contrôle des naissances 
Soit (Yn) (n > 1) une suite de variables aléatoires indépendantes, suivant 
chacune la loi de Bernoulli 460 + 1). On convient que, pour tout n > 1, 
la variable Y, est égale à 1, si une famille donnée obtient un garçon lors de 
la ne naissance et O dans l'autre cas. Les naissances jumelles ou triples ne 
sont pas considérées dans ce modèle! Par conséquent, X, := Y1+:::+Y, 
est le nombre de garçons après les n premières naissances et X, suit la loi 
binomiale B(4, n). La famille applique un système de contrôle de naissances, 
qui consiste en la donnée d’un temps d’arrêt N par rapport à la suite (Y:) 
(nr > 1). Le nombre de garçons dans une famille pratiquant ce système de 
contrôle des naissances est alors X x. 

D’après l'identité de Wald généralisée, on a E{Xn] = EfN]E[X1] = à E[W]. 
Autrement dit, quel que soit le système de contrôle de naissances choïsi, la 
proportion de garçons (et de filles) est la même, en moyenne. 


Exempie (a} La famille décide de s'arrêter de procréer dès que, pour la première 
fois, elle à eu deux garçons consécutivement. Évaluer le nombre moyen 
d’enfants et de garçons dans la famille. 


Exemple (b} La famille décide de s'arrêter de procréer dès que, pour la première 
fois, un garçon succède immédiatement à une fille. Évaluer le nombre moyen 
d'enfants et de garçons dans la famiile. 


2.8 Considérons une suite infinie (Y,) (n > 0) de variables aléatoires 
indépendantes, suivant chacune la loi de Bernoulli geo + pe1 avec 0 < p < 1 
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et g = 1— p. À l’aide de cette suite, on définit une autre suite {Xn) (n > 0) 
de variables aléatoires, en posant : 
+1, si l'évènement {Yo = 1, Yon+1 = 0} est réalisé; 
Xn = { —1, si l'évènement {V2 = 0, Yny1 = 1} est réalisé; 
0, si l'évènement {Ya = Yany1} est réalisé. 
De plus, on pose : T':= inf{n > 0: X, = +1 où Xn = —-1}. 

{a) La variable aléatoire T est un temps d'arrêt adapté à la suite (X) 
{nr > 0). Il est presque sûrement fini. Déterminer sa loï de probabilité et son 
espérance mathématique. 

(b) Calculer la loi de probabiülité de la variable aléatoire Xr. 


Chapitre 3 


Processus de Poisson 


Le processus de Poisson sur la droite est un processus à temps continu et à 
valeurs entières positives. On dit encore que c'est un processus de comptage, 
que l’on note {N{t) : t > 0}. Il s’agit d'étudier le nombre aléatoire N(+) 
de certains évènements qui se produisent dans un intervalle de temps [0,t| 
donné. Sa grande popularité dans les applications vient notamment du fait 
que beaucoup de calculs le concernant sont explicites. 


3.1 DÉFINITION ET PREMIÈRES PROPRIÉTÉS 


On se propose d'étudier la répartition dans le temps d’instants aléatoires, ap- 
pelés instants-r. Dans les applications, ce sont les instants où se produisent 
certains évènements spécifiques, comme, par exemple, les émissions de par- 
ticules radioactives, les appels dans un central téléphonique, les arrivées de 
clients devant un guichet, etc. Par analogie avec le premier exemple cité, on 
appelle ces évènements des tops, qui se produisent donc aux dits instants-r. 


Définition 3.1.1. Désignons par N(t} (t > 0} le nombre de tops se produisant 
dans l'intervalle de temps [0,t] et supposons que N{0) = 0. Le processus 
{N(#) :t > 0} est appelé processus de comptage. 


Tout processus de comptage vérifie les propriétés suivantes : 
(a) Pour tout t > 0 le nombre N(t) est à valeurs entières positives. 
(b) La jonction tr N(t) est croissante. 
(c) Pour tout couple (a,b} (0 < a < b}, la différence N{b) — N(a) représente 
le nornbre de tops se produisant dans l'intervalle de temps |a, b]. 
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Soient /1,... , 1; des intervalles sur l’axe des temps, disjoints ou non; soient 
N,... , Nx le nombre de tops se produisant dans ces intervalles. Le k-uple 
(M,...,Nx) est un point aléatoire à valeurs dans N*, admettant une loi de 
probabilité £. Faisons subir à tous les intervalles F1,...,/4, simultanément, 
une même translation sur l'axe des temps. Soient J{,...,1; les intervalles 
translatés et N},...,N/ le nombre de tops se produisant dans ces intervalles. 
Le k-uple (N1,..., N{) est un point aléatoire à valeurs dans N° admettant la 
loi de probabilité L’. 


Définition 3,1.2. Le processus de comptage {N(t) : t > 0} est dit à accroisse- 
ments stationnaires, si quel que soit k, quelie que soit la suite (71,...,/4) et 
quelle que soit la translation, les lois £ et L’ coïncident. 


Lorsque & = 2, on peut reprendre cet énoncé de la façon suivante : si 
un processus de comptage est à accroissements stationnaires, alors la loi de 
probabilité du nombre de tops se produisant dans un intervalle de temps donné 
ne dépend que de la longueur de cet intervalle. 


Définition 3.1.3. Un processus de comptage est dit à accroissements indépen- 
dants, si les nombres de tops se produisant dans des intervalles de temps 
disjoints sont indépendants. 


Définition 3.1.4. Un processus de comptage est dit localement continu en 
probabilité, si pour tout t>0,ona 


lim PEN (6 +h)—N()>1}=0. 


Parmi les processus de comptage, ce sont les processus de Poisson, définis 
ci-après, qui jouent un rôle prépondérant. 


Définition 3,1.5 (Processus de Poisson), Un processus de comptage {N{t),t > 
0} est appelé processus de Poisson, de densité À > 0, s'il vérifie les propriétés 
suivantes : 

&) N(0)—0; 

(it) le processus est à accroissements indépendants; 

{äii) le nombre de topsse produisant dans un intervalle de temps de longueur 
t > 0 suit la loi de Poisson de paramètre Àt, c'est-à-dire, pour tout s > 0 et 
toutié>0,ona: 

n 
P{N(s+t)- N(s)=n}= MC {R > 0). 


Voici quelques propriétés que vérifie un processus de Poisson. 


Propriété 3.1.1. Un processus de Poisson est à accroissements stationnaires. 


Démonstration. Faisons la démonstration pour deux intervalles Ja, cl, ]b,d], 
avec à < b < c < d. Comme le processus est à accroissements indépendants, 
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on à : 

P{N(c) — N(a) = &,N(d) — N(b)=1} 
= D P{N(E) — Ne) = à, N(e) — NB) = ir, N(d) — N(0) = is} 
= D P{NG) — Na) = h}P{N (0) — N(b) = à }P{N(d) — Nc) = is} 
25e Q( — a}}f (A(c— 8)}f2 (A(d — cj}is 


ül io! ia! 


où la somme est sur toutes les suites (d:, 42, i3) d’entiers tels que à +42 = k et 
ia + is = l. Or, cette expression ne dépend que des longueurs des intervalles 
mis en jeu, non de leurs positions sur la droite. [] 


Propriété 3.1.2. Un processus de Poisson est localement continu en proba- 
bilité. 

Démonstration, Puisqu'un processus de Poisson est à accroissements station- 
naires, on a P{N(+h) — N(t) > 1} = P{N(R) — N(0) > 1} = P{N(R) > 
1}=1-P{N(h) = 0} =1-—e/* — 0, lorsque À tend vers 0. [] 


On voit ainsi qu’un processus de Poisson vérifie les quatre propriétés 
{1) N(0) = 0; (2) il est à accroissements indépendants; (3) il est à 
accroissements stationnaires; (4) il est localement continu en probabilité. 

Il est remarquable que ces quatre propriétés, malgré leur caractère quali- 
tatif, suffisent à assurer qu’un processus de comptage soit de Poisson. La 
démonstration de ce fait est donnée dans le paragraphe 6 de ce chapitre. 


Propriété 3.1.3. Soit {N(t) : # > D} un processus de Poisson de densité 
À > 0. Alors, lorsque h tend vers 0, 

G) P{N(R) = 1} = Àh + o(h); 

Gi} P{N(h) > 1} = ÀR +o(h). 
Démonstration. En eflet, P{N(R) = 1} = eh = Xh + o(h); puis 


PNG) 227= 3e QE 2 en QE 
k2>2 k>0 
se Mçne3 CD AL (y, d'où (D. 0 
k>0 k! 


Propriété 3.1.4. Pour tout t > 0 la probabilité pour qu'il se produise une 
infinité de tops dans [0,4} est nulle. De façon équivalente : avec probabilité 1, 
la suite T1,72,... des instants où se produisent les tops n'admet pas de valeur 
d'adhérence à distance finie. 


Démonstration. Pour tout t > 0,ona 


x D} 
P{N(D < +0) = DPIN(D = tpm MS ME 21 Q 


k>0 #>0 
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Comme W{(t) est une variable de Poisson de paramètre Àf, on a E[W(4)]/t = 
À. Ainsi À est l'espérance mathématique du nombre de tops se produisant par 
unité de temps. C’est la fréquence moyenne des tops. Comme la variance vaut 
aussi Àf, on en déduit la propriété suivante. 


Propriété 3.1.5. Dans un processus de Poisson {N(t) : t > 0}, de densité À, 
on a: 
cUN(E)) _ 1 


ENG) Vi 
qui tend vers +0 lors que t | 0. 
Par conséquent, pour t > 0 petit, les fluctuations autour de la moyenne 
sont grandes par rapport à la moyenne. 


u 

Propriété 3.1.6. On a VG@ ) » 2%, }, lorsque t tend vers l'infini. Ainsi À est la 
densité temporelle d’occurrences des tops. 
Démonstration. Notons X1, X2,..., X141 le nombre d’occurrences des tops dans 
les intervalies [0,1], 11,2], ... ,][#]-1,{#]] (é > 1). Les X4 sont des variables 
aléatoires, indépendantes, identiquement distribuées, d'espérance mathéma- 
tique À. D’après la loi forte des grands nombres, on à donc : 

N(fE]) _ Xit-+ Xe Ps, 

2 TEA 2e mix = 
il ü 1 
et de même, 

VO rex, 


lorsque + tend vers l'infini. [| 


3.2 TEMPS D'ATTENTE. ESPACEMENTS 


Soit {N{t) : & > 0} un processus de Poisson de densité À > 0. On note 
Ti le temps d'attente du premier top (à partir de t = 0) et T, (n > 2) la 
durée séparant le (n — 1) du n%% top. On dit encore que les T, sont les 
espacements. À la suite (T,) (n > 1), on associe la suite ($,) (n > 0) définie 
par: S:=0et S,:= Ti +...+7, (n > 1). Par conséquent, S, (n > 1} est 
l'instant où se produit le #Ÿ"% top ou encore le temps d'attente du ni? top 
{à partir de = 0). 


Théorème 3.2.1. La suite (Tn) (n > 1) est formée de variables aléatoires 
indépendantes, dont chacune suit la loi exponentielle de paramètre À (x > 0). 
Démonstration. Montrons que, pour tout n > 1, la densité conjointe du vecteur 
(Ti... Tn) est le produit Àe24...Xe-Âte de n densités exponentielles de 
paramètre À. Le changement de variables tx; + sp, où sg := à +. +ty 
{1 < k < n} montre que la densité conjointe de (T:,...,7,) au point 
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(t1,... , in) est égale à la densité conjointe de ($1,...,5,) au point (31,...,8n), 
ù + < Sn. 
Calculons cette dernière densité. Pour ce faire, considérons l'évènement 


An = {Si € [1,81 + hf, So € [82,80 + hof,..., 84 € [en,8n + hal}, 


où les 5; et les h; ont été choisis de sorte que 0 < 53 < 51 + h1 < 52 < 
82+ho << 55 < sn +hn. Alors P(A,) est la probabilité de la conjonction 
des évènements : 

zéro top dans {0,s1[ et exactement un top dans {s:,s1 + Rif; 

zéro top dans [51 + A1,s2[ et exactement un top dans {s2, 52 + hol; 


D 
zéro top dans {s_1 + hn_1,sa[ et exactement un top dans [s2, sn + An. 
D'où 
P(An)=e Se Ah x pere 8 he Al pe 
à gr Mn énnrhar) Xe À pe 
Ze À me din X9 he fn, 
soit, en divisant par h1---h; et en faisant tendre chaque h; vers 0, 
1 

Bree ln 


qui est la densité de (S1,...,8,). Comme s, = #1 +---+4,, on en déduit que 
ÀeÂt... XeAîn est la densité de (11,...,73). [ 


P(Ax) — Mer, 


Remarque. Il résuite du précédent théorème que EÎT,] = EfSn — Sn-1] = 
1/À. Ainsi, la densité À est encore l'inverse de l'espérance mathématique de 
l'intervalle de temps séparant deux tops consécutifs. 


Théorème 3.22. Pour tout n > 1, la variable 8, = Ti +. + Tn, 
qui représente l'instant où se produit le n°" jop, suit la loi gamma de 
paramètre (n, À}, à savoir la loi de densité : 

5" Os), sis>0; 


0, sinon. 


fs (s) = { 


Démonstration. La variable $, est, en effet, la somme de n variables aléatoires 
indépendantes, suivant toutes la loi exponentielle de paramètre À. Elle suit 
donc une loi gamma de paramètre {n, À) (ef. [FF1], chap. 14,88 c}}. [ 


Ce théorème permet de donner une autre définition des processus de Pois- 
son, qui à aussi l'avantage de montrer qu’on peut construire effectivement un 
processus de Poisson à partir d’une suite de variables aléatoires exponentielles. 
Cette construction fait l’objet du paragraphe suivant. 
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3.3 LA SECONDE DÉFINITION DES PROCESSUS DE POISSON 


Soit donnée une suite (T,) (n > 1) de variables aléatoires indépendantes, 
dont chacune suit la loi exponentielle de paramètre À > 0. On lui associe un 
processus de comptage {N() : # > 0} en convenant que le n°" top a lieu à 


l'instant S, := T1 ++. +7,. En posant So := 0, on suppose donc : 
NE) = sc (8.3.1) 
n>l 


Dans ces conditions, on a le résultat suivant. 
Théorème 3.3.1. Le processus de comptage {N(+) : > 0} ainsi défini est un 
processus de Poisson de densité À. 
La. démonstration résulte des deux propositions suivantes. 
Proposition 3.3.2. Pour tout t > 0, la variable aléatoire N(t) représentant 


le nombre de tops se produisant dans l'intervalle de temps [0,t] suit la loi de 
Poisson de paramètre Àt. 


Démonstration. La démonstration repose sur l'identité : 
{Sa <t={Nt>n} (t>0n2>0). (3.3.2) 


En effet, l'instant où se produit le nŸ% top est inférieur ou égal à t, si et 
seulement si, dans l'intervalle de temps [0,4], il s’est produit au moins n tops. 
On en déduit : 
P{N(t)=n}=P{N(G)>n}-P{N() >n+1} 
= P{Sn <#} — P{Sou St 
d’où, en vertu du Théorème 3.2.2 


nl Pal 
PIN =n}= fe = (Ar GT 2 fre 


Supposons donnés un entier m > 1, une suite (#,) (n > 1) de nombres 
réels positifs et une suite (i,) (n > 1) d’entiers positifs. Pour n > 1, posons 
In = ti tit... + et aussi 80 := 0. 

Proposition 3.3.3. La probabilité que l’on ait à tops dans [0, s1], io tops dans 
Ï81, 82], ... , n tops dans ]sm_1,s5m] est donnée par : 

P{N(s1) = à, Nsa) — Nfs1) = d,..., N(sm) — N{sm_1) = im} 

eh (Xe) er ( Xéo}i2 : en (Mém)t® 


h! io! im! 


Avant de donner la démonstration, établissons le lemme suivant. 
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Lemme 3.3.4. Soient à un entier tel que à > 2 et 8,t deux nombres réels tels 
que t > O0. Alors 
2 0-3)? 


oo 
G—2) | 


dy dx = sr 
LA 


s<yLr<s+t 
Démonstration. Il s'agit du calcul d’une mére doubie dans un triangle : 
x hEZUT (æ NT æ=[" af” x! Se 
(2)! G- 
(G+t-y)it COX 
= NT dy = : 
[” Gin = ge D 
Démonstration de la Proposition 3.3.3. La Proposition est d’abord vraie pour 
m = 1. C'est le contenu de la Proposition 3.8.2. Posons : 


A:= {N(a) = à, N(82) — N(s1) = to, , Nsm) — N{Sm-1) = im} 
et définissons les variables suivantes : 


SLYLTESHE 


Xi := plus grand instant-r dans [0,s:], si > 1; 
{non défini si à = 0); 
pour k=1,2,...,m—t, 
Ya := plus petit instant-r dans ]s4, 8541] si ég41 > 1; 
(non défini si 1 = 0); 
M, 


pour k = 
X3:= plus grand instant-r dans ]sx_1,5%] si ëx > 2; 
(non défini si à = 0 ou i); 
Yan := plus petit instant-r au-delà de 5. 
Dans l'exemple suivant, où m = 4 et {é1,49,t3,44) = (2,0,1,3), les tops ont 
été représentés par des croix. Les variables Y1 et X2 ne sont pas définies, car 
ä = 0, la variable X3 n'est pas définie, car i3 = 1. 


L 
El St 53 84 
X1 PF Ya  X1 Ya 
L'évènement À peut encore s'exprimer comme 
{0<XI<H << IS << X3<s8<.. 
Smet < ni < Xm € 8m < Ym}, 

avec la convention suivante : 

(a) la relation “X1 < ” disparaît de l'évènement À, si à = 0; 

(b) pour k=1,...,m —1, la relation “ < Y4” disparaît de l'évènement À, 
si dar = 0; 
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(c) pour & = 2,...,m, la relation “X4 < ” disparaît de l'évènement À, si 
ik = 0,1. 
Dans l'exemple traité, l'évènement À s'exprime comme : 


{0 < Xi < s1 < 82 < Ya < 83 < Ya € Xa < 84 < Wa}. 


Notons Z1 < Z2 < --. < Zy la suite des variables X3, Y£ apparaissant 
effectivement dans À. Par construction-même, Z, = Y,, et il existe une suite 
strictement croissante d’entiers 1 < b1 < bp < --- < bj telle que 


A=Ti+. +, Z2-ZA= Tnt... +, 
Ze Zu = Thin te + TT. 


Posons @1 := b1, @2 := bo — bi, ... , a = b — b_1. Alors & = 1, puisque 
Zi = Yn. Comme les variables aléatoires T; sont mutuellement indépendantes, 
par hypothèse, les variables aléatoires Z1, Z2—71,... , Z—Z_à le sont aussi. 
De plus, Z1 suit une loi gamma de paramètre (À,a&), puis Z2 — Z1 une loi 
gamma de paramètre (À,a2), .. , enfin Z—Z;_1 une loi gamma de paramètre 
Ga). 

Le vecteur (Z1, Z2—Z1,...,Z—Z3_1) a donc une densité qui est le produit 


des densités des lois gamma de ses composantes. Par ailleurs, Le jacobien de 

passage du vecteur (Z1,Z2—21,...,Z-—Z3-1) au vecteur Z := (Z:,Z2,...,2Z) 

est évidemment égal à 1. Par conséquent, la densité de ce dernier vecteur, pour 
n20,22>0,... ,z > 0, est égale à 

À À 

ani an Men) (1(20 = 2). 

x —À © 

(a —1)! 

ou encore, en posant 29 := Ü, une expression égale à 


ea (a ja —1 


e RAD (Aa — 4), 


x Àe Ta, (3.3.3) 


puisque a = 1. Il reste donc à intégrer cette densité sur l'évènement À pour 
trouver la probabilité de À. 

Si Z1 = X1, alors a = à > let 0 < X1 < s1; dans le produit (3.3.3), 

Gr 
Zn = Yy avec K > K, alors a; = 1 et 8x < Vi < 8441; de plus, le terme 
indicé par j dans (3.3) vaut simplement À. Enfin, si Z; = Y4 et Z;11 = Xy avec 
k'> k, alors & = k+1, puisa; = l,ajyi = ipu—letse < Yi < Xpy1 < Sky; 
de plus, le produit des deux termes consécutifs, indicés par j, j + 1 vaut : 
je OGrn = y}? 
(41 — 2)! 


le terme correspondant à j = 1 vaut À . De même, si Z; = ÿ4 et 


. Comme Z; = Yn et 5m < Yn, l'intégration de la 
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densité de Z sur À est égale à : 


& (ail 0 
Î A x IT x [ de" dun, (3.3.4) 
0 (1)! 1Sk m1 
Reel 


où la première intégrale disparaît si é; = 0 et où 


Gr D) 


Hy = 
M (eh — 2)! 


CPS TETE SET 


dyx dœr+ Si ig4r > 2; 


= Adyk, lorsque i41 = 1. 
CSSTAU TS 
La première intégrale du produit vaut (As1)/il, qui donc se réduit à 1 
lorsque à = 0 et la dernière intégrale est égale à e%#, L'intégrale double 
Aer 
vaut Hx = = Cine at) 
fil 
valeur de H4 lorsque ix41 = 1 ef lorsque i4; = 
L'expression (3.3.4) est donc égale à : 


; d'après le Lemme 3.3.4, une valeur qui est aussi la 


(si) x ( Il Que) x Xe I] ee (Ats)'e 
2 SE — ; 
à! 1SkSm-1 EH 1<k<m ik! 


puisque 81 — 1 et 8m = ti +éo+e. tm. [] 


Pour terminer la démonstration du Théorème 3.3.1, il suffit de vérifier 
que les propriétés (i), (ii) et (ii) de la Définition 3.1.5 sont satisfaites. Or, 
lévènement {N(0) > 1} entraîne que {71 = 0} s’est produit, mais cet 
évènement est de probabilité nulle. On a done W(0} = 0, ps. 

Récrivons la Proposition 3.3.3 pour m = 2. On obtient : 


et (Xts)f er (to) 

ü! io! 
D'après la Proposition 3.3.2, la suite ({Ns1) = ü}) (à: = 0,1,...) est un 
système complet d'évènements. En sommant (3.3.5) par rapport à ä1, de O à 
l'infini, on obtient, pour tout i > 0, 


P{N(s1) = ü, N(82) — N(si) = ia} = (8.3.5) 


Qi) 


P{N(s2) — N(s1) = ia} = ii 


(8.3.6) 


D'après la Proposition 3.3.2, on en déduit : 
PEN(s1) = in N(s2) — N(s1) = i2,... , N(8m) — N(8m-1) = im} 
= PN(s1) = à} P{N(s2) — N(s1) = és} 
- X P{N(Sm) — N(sm-1) = im}. (8.3.7) 


Le processus est donc bien à accroissements indépendants. Enfin, la pro- 
priété (ii) n’est autre que (3.3.6). 
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3.4 ÂGE, TEMPS DE VIE RÉSIDUEL 


Considérons un processus de Poisson {N(t) : # > 0}, de densité À et conservons 
les notations des précédents paragraphes quant aux variables T, et S,. 

Pour tout t > 0 l'intervalle [Sy), Sxçys:l contient t; en effet, Sy) 
est la date où se produit le dernier top avant & (puisque N{t) est une 
variable aléatoire de Poisson, elle prend, presque sûrement, des valeurs entières 
positives finies). D'autre part, Sy, est la date où se produit le premier top 
après t. 


T; P T' T" 
tunes mate Pme amttanmes 
0 S Sa Se t Snty+1 
Try 


Partageons l'intervalle [Svç, Sntor1l, de longueur Tyy41, en les deux 
intervalles partiels disjoints Brot et [6 Svwj+1l de longueurs respectives 
T' et T”. Imaginons que les tops soient les dates de naissance d'individus 
qui disparaissent au top suivant. Alors l'intervalle T'=t-$ nee) est l’âge de 
l'individu en vie à la date t et T” = Syyyya — t est le temps de vie résiduelle 
de l'individu en vie à la date t. On a T1 = T'+T”; de plus, comme on le 
montre ci-dessous au £ 4.3, les variables aléatoires T” et T” sont indépendantes. 


3.4.1 La loi de T’ 
Cette variable prend ses valeurs dans [0,f]. Pour tout s > £, on a donc 
P{T' > «} = 0 et, pour tout s € [0,4], 
{T'>s}= {t- 8x > 8} = {Sn <t—5} 
= {0 top dans [t — s,t]}; 
d'où 
P{T'> s}= P{0 top dans [£-s,4]} 
= P{0 top dans {0, s]} = e*. 
Par conséquent, 
‘ _fe#, sisef(0,t; 
rs {e sis>t. 
La loi de T' est donc la loi de T1 At. 


3.4.2 La loi de T” 


Que T” et Ti soient de même loi, résulte de la propriété d'absence de mémoire 
de la loi exponentielle. On peut encore le montrer comme suit : T” prend ses 
valeurs dans [0, +oo[. Pour tout s > 0, on a donc l'équivalence des évènements : 
IT" > s} = {Son —t> s}= {Sven > t+s}= {0 top dans [t,t+s]}; 
d'où P{T">s}=e"X. [] 
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3.4,3 Indépendance 
Montrons que T” et T" sont indépendantes. Pour 0 < x <t,y>0,ona 


{T'> 2, T" > y} = {0 top dans [2,4 +y]}, 
d'où 
PET >a,T" > y} = e EH) 2 P{T' > x} P{T" > y}. 
Pouræ>t,y>0,ona: 
P{T'>a,T">y}=0=P{T'>2}P{T" > y}. | 


En définitive, on a Tyçe41 = T'+T", où T', T” sont des variables aléatoires 
indépendantes telles que L(T”) = £L(T At), L(T”) = £(Ti). I en résulte 
L(Tn41) = (T1 At) * L(T1), où “#” désigne le produit de convolution (cf. 
[FF1}, chap. 11, 66). 

En revanche, les variables aléatoires Tiytx)42, Tips, ... sont indépen- 
dantes, identiquement distribuées, de loi £(T:). Il en résulte que la suite des 
variables aléatoires T”, Taty+2, Tnt+3, … qui représente la suite des durées 
séparant deux tops consécutifs à partir de la date t, a les mêmes propriétés 
statistiques que la suite des variables aléatoires T1, T2, ... qui représente la 
suite des ces durées à partir de la date 0. Il est alors clair que le nombre de 
tops dans j#,4+s] (t,s > 0) a la même loi de probabilité que le nombre de tops 
dans ]0,s], autrement dit, que le processus est à accroissements stationnaires. 


3.4.4 Temps d'arrêt 


Soient {N(£) : t > 0} un processus de Poisson de densité À > Get (T,) (n > 0) 
la suite de ses espacements. 


Proposition 3.4.1. Soit 4 > 0 fisé. Alors 

(a) la variable aléatoire N(t) west pas un temps d’arrêt adapté à la suite 
BA) (R21); 

(b) la variable N(t)+1 est un temps d’arrêt adapté à la suite (Tn) (n > 1). 
Démonstration. L’évènement {N(t) = n} est la conjonction des évènements 
{Di+e+T <t}et {Ti+.--+ Ty: > #}. Ainsi, N(t) est l'indice du dernier 
top se produisant dans [0, #]. En revanche, {N(t)+1=n}={N{t)=n-—1}, 
qui est la conjonction des évènements {T1+--.+ 71 <t}et {Ti+...+7 > 
t}, est l'indice du premier top se produisant dans ]f,+oo[. [] 


Revenons à l'étude des instants St), Sn(+1 et des variables aléatoires 
T'=t- Sy, T = Sntys1 — t. On a : E[T] = fSP{T' > s}ds = 
fe-N ds = (1-e-"}/x. D'où ElSvç] = #-(1-e7/À; puis EfT"] = 1/À, 
d'où EfS til = t+1/À. 

Si N(t) était un temps d'arrêt, on pourrait appliquer l'identité de Wald 
généralisée (cf. 82.5) et l'on aurait : E[Syç] = E[N(#)]E[T1} = At: (1/X) = t. 
On ne trouve pas le même résultat! 
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En revanche, N{t) + 1 est un temps d'arrêt. On peut appliquer l'identité 
de Wald. On obtient : E[Swço41] = E[N(t) + 1]E(T1] = (At+1)/X = ++ 1/À. 


3.4.5 Le paradoxe de l'inspection 


On peut l’exprimer de la façon suivante. On dispose d’une provision infinie 
d’ampoules dont les temps de vie sont des variables aléatoires indépendantes, 
identiquement distribuées selon la loi exponentielle de paramètre À > 0, 
avec À inconnu. À l'instant 0, on allume une ampoule et on la remplace 
instantanément dès qu’elle s'éteint. La suite des instants où les ampoules 
s'éteignent (les tops) définit alors un processus de Poisson {N(#) : t > 0}, 
où N(t) désigne le nombre d’ampoules consommées dans l'intervalle {0, #]. 

On note Ti, T2, ... les temps de vie des ampoules successives. Ce sont 
des variables aléatoires indépendantes suivant toutes la loi exponentielle de 
paramètre inconnu À. On se propose d’estitner À au moyen de La procédure 
suivante ({ inspection») : 

1) On fixe un instant # > Q. 

2) On observe le temps de vie de l’ampoule qui brûle à l'instant £. Avec 
les notations ci-dessus, ceci revient à étudier la variable aléatoire Ty(9+1. Or 
Tnwa1 = T'+T", où T’ et T” sont deux variables aléatoires indépendantes 
dont les lois de probabilité ont été calculées ci-dessus). On a donc 


+ t 1 et 

EfT”] = f P{T'> s}ds = EX ds = = — ; 
(0 (] À 
1 

om = L 
E[T”] = x 
Il en résulte : 
ñ m2 e 1 
Effral = ET) + EE > > SEM]. 


On constate que pour tout t > 0 la durée de vie moyenne de l’ampoule qu’on 
inspecte à l’instant t est strictement supérieure à la durée de vie moyenne des 
ampoules non inspectées. C’est en ce phénomène que réside le paradoze de 
l’inspection. L’inspection, i.e., l'observation de l’ampoule à l'instant t produit 
une perturbation qui a pour effet de dilater la durée de vie moyenne de 
l’ampoule inspectée (cf. le proverbe italien : {L'œil du maître engraisse le 
cheval. »). 


Remarque 1. Lorsque # tend vers l'infini, la loi de probabilité de T” tend vers 
celle de T1 et EfTç+1] — 2/X = 2E[T]. Pour de grandes valeurs de £ la durée 
de vie moyenne de l’ampoule qu'on observe à l'instant é est pratiquement 
le double de la durée de vie moyenne des autres ampoules. Le paradoxe de 
l'inspection est particulièrement saisissant dans ce cas. 


Remarque 2. Comme Tn(+1 = T'+T", la loi de probabilité de Tyçy+1 est la 
convolution de la loi exponentielle de paramètre À et de la loi de probabilité 
Ti A t. Lorsque t tend vers l'infini, cette loi tend vers la convolution de deux 
lois exponentielles de paramètre À, c'est-à-dire, vers la loi l'(2, À). 
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Remarque 3. Parmi les ampoules, il y en a qui brülent plus longtemps que 
les autres. Si l’on choisit un instant £ > 0, on a plus de chances de tomber 
sur une ampoule qui brûle longtemps que sur une ampoule qui brûle moins 
longtemps; ce serait là une explication intuitive du paradoxe. Il y à pour- 
tant un hic dans cet argument, puisqu'il n'exclut pas qu'il puisse y avoir des 
ampoules qui brûlent peu de temps; l'explication n’est valable qu'a posteriori. 


3.5 DISTRIBUTION CONDITIONNELLE DES INSTANTS 
D'ARRIVÉE 


Supposons que nous connaissions le nombre de tops qui se sont produits 
dans {0, #}. Que peut-on dire de la distribution conditionnelle de leurs instants 
d'arrivée ? 

Théorème 3.5.1. Conditionnellement à l'évènement {N(t) = n}, la loi de 
probabilité des n tops apparaissant dans [0,t] est égale à la loi de probabilité 
de n variables aléatoires indépendantes, identiquement distribuées, de loi 
uniforme sur [0,t]. 

On peut écrire l'énoncé du précédent théorème sous la forme suivante. 


Théorème 3.5.1’. Soient I un intervalle de {0,t] et n un entier. Soit, d'autre 
part, (Y1,...,Y,) une suite de n variables aléatoires, indépendantes, iden- 
tiquement distribuées de loi uniforme sur [0,1]. Alors, conditionnellement à 
l'évènement {N(t) = n}, la probabilité pour qu’eractement k tops se pro- 
duisent dans I est égale à la probabilité pour qu'’eractement k parmi les vari- 
ables Y1, ... , Y, prennent leurs valeurs dans I. 

Démonstration. Supposons que J soit de longeur u (0 < u < t) et désignons 
par X (resp. Y) le nombre d'instants-7 situés dans { (resp. dans |9,t] \ 1). 
On à X +Y = N(t); d'autre part, X et Y sont des variables aléatoires 
indépendantes suivant des lois de Poisson de paramètre respectif Au et A(t—u). 
Pour k = 0,1,...,n, on a alors : 


P{X=k|IN@)=n}=P{X=k|X+Y=n} 
LPEX=EX4+Y=n} _ P{X=HY=n—K} 


P{N(G)=n} _ PIN =n} 
_ P{X=Kk}P{Y =n-k} 
7 PWO=n 
ju) Late Qt a) nu (4) 
= nl 0 AD y 09 


une expression qui est indépendante de À, qui est bien la probabilité pour 
qu'exactement & variables parmi Y1,... , Ÿ, prennent leurs valeurs dans {. [] 
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Donnons maintenant un lemme sur les échantillons ordonnés. Si X — 
(X1:..., Xn) est une suite de n variables aléatoires indépendantes, identique- 
ment distribuées, absolument continues (de sorte que la probabilité pour 
que deux variables X; et X; (  j) soient égales, est nulle), on note 
(XT < X3 < ::: < X%) la suite des X; rangés en ordre croissant. Cette 
suite est appelée l'échantillon ordonné. 


Lemme 3.5.2. Soit X = (X1,...,Xn) une suite de n variables aléatoires, 
indépendantes, identiquement distribuées, absolument continues, de densité f. 
Alors l'échantillon ordonné X* := (XŸ < X5 <... < X%) admet une densité 
conjointe donnée par 


n 
nt TI fs) Ie avec E= {(æ1,...,œn) : 21 < mo << æn}. 


i=1 


Démonstration. À tout élément & appartenant au groupe des n! permuta- 
tions de 1,2,...,n, faisons correspondre le sous-ensemble E{o) des vecteurs 
(t1,%2,...,æn) de R° tels que toi < Zo2 < -:: < Ton. Notons que R° est 
la réunion des ensembles disjoints E(o) et du sous-ensemble, de mesure de 
Lebesgue nulle, des vecteurs qui ont au moins deux composantes égales. 

Soit g la fonction qui envoie tout vecteur sur le réarrangement croissant 
de ses composantes. En particulier, X* = go X. De plus, la restriction 
ge de g à E(c) envoie le vecteur (x1,32,...,æn) de E(o) sur le vecteur 
(Got: Lo2:..., Ton) de E; en fait, g, est une transformation linéaire ayant 
pour matrice une matrice de permutation, dont le déterminant est +1. Le 
jacobien de g; est donc égal à 1. Alors, pour toute permutation & et tout 
borélien B C E, on a, par le changement de variables x + g{x), en posant 


fx) := fa): fan), 
Le Fxto)de = [| fx(ex (du. 


Or, si 7 est la permutation inverse de o, pour y = {1 < --: < ÿn}, on a: 


x (5) = fur) ++ (ra) = fu): Fun) = fx) et donc 
Î un Er = Lx dv. 
Comme Px+(B) = P{X* € B} = P{goX € B} = Px{g € B}, on en déduit : 
Px:(B) = f, Iyeryfx (x) de = DIR Tes) fx(x) de. 
> Lee fn fx du, 


ce qui montre que la densité de X* est n! f(x1)--- f(xn) sur Fet 0 ailleurs. [ 


Cas particulier. Si le n-uple (X1,X2,...,X,) est formé de variables aléatoires 
indépendantes, identiquement distribuées, de loi uniforme sur {0,t], la densité 
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conjointe de Péchantillon ordonné (X?,X5,:--, X*) est donnée par 


1 
na le avec E={(r1,...,æ) : 0 < ri < vo <-.. <æn <t}. 


Proposition 3.5.3, Conditionnellement à l'évènement {N(t) = n}, le n-uple 
(S1,S2,...,8,) a même loi de probabilité que le n-uple ordonné correspon- 
dant à n variables aléatoires indépendantes, identiquement distribuées, de loi 
uniforme sur [0, t]. 

Démonstration. Soient O0 < x1 < z2 < --: < zn < t une suite (strictement) 
croissante et A1, ho... , kA des nombres strictement positifs suffisamment 
petits pour que z1 < 21 + h1 < do < mo + ho < ++: < œn_1 < Tn-1 + An-1 < 
En < En + An <t. Alors 


P{S1 € ferai + hi... , Sn € [nn + An]|N(#) = n} 
_ PIS: € fers + ha]... Sn € [en œn + An], N(E) = n} 


P{N()=n} 
__ P{un seul top dans [x;,xi + hi} (i = 1,...,n); 0 ailleurs} 
: P{N(E) = n} 
: e Mi Xp eee Me Xh, eh ln) 
e-X C5 
n! 
En divisant par f1,...,h, et en faisant tendre successivement hi, ... , hs 


vers Ü, on trouve la densité correspondante : 


E 
nl, avec E=f{(r,...,2n):0<m <a<...<z <t} [ 


3.6 CARACTÉRISATION « QUALITATIVE » D'UN PROCESSUS 
DE POISSON 


Comme déjà annoncé dans le premier paragraphe, quatre conditions “quali- 
tatives” suffisent à s'assurer qu’un processus de comptage est de Poisson. 


Théorème 3.6.1. Soit {N(+) : t > 0} un processus de comptage vérifiant les 
propriétés suivantes : 

(1) N(0) = 0; 

(2) le processus est à accroïissements stationnaires ; 

(3) le processus est à accroissements indépendants ; 

(4) le processus est localement continu en probabilité, c'est-à-dire, pour tout 
420, P{NG+Rh)— N(t) > 1} tend vers O avec h. 

Alors le processus est de Poisson. 
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Démonstration. En vertu de (2) et de (1), pour tout k > 0, on a : P{N(E+ 
Rk)- NG) >1} = P{N(h) —- N(0) > 1} = P{N(h) > 1}, une quantité qu'on 
pose égale à p(A). C'est la probabilité pour qu’il se produise au moins un top 
dans un intervalle de temps de longueur k > 0. La condition (4) implique 
Em p(h) = 0. 

Pour terminer la démonstration du théorème, trois lemmes sont à établir. 


Lemme 3.6.2. Pour tout t > 0, on a : p{t} = 1 — et, avec À > 0, 
Démonstration. Posons f(t) := 1 — pt) = P{N() = 0}. Il résulte des 
conditions (2) et (3) que, pour tout £ > O et tout k > 0, on a : f(t+ h) = 
f{t)f(). La solution identiquement nulle est exclue; en effet, cette solution 
équivaudrait à p{t) = 1 pour tout { > 0, en contradiction avec (4). On a donc 
F6) = e7%, avec, puisque f est bornée, À > 0 (cf. [FF1], chap. 14, Exercice 1), 
d’où pt) = 1— f(t) = 1—e7/t, avec À > 0. Le cas À = 0 est inintéressant, il 
entraînerait que, pour tout # > 0, on aurait p{t) = 0, c'est-à-dire, qu'avec une 
probabilité égale à 1, il ne se produirait aucun top. [| 


Dans la suite, on suppose donc À > Ü et, par conséquent, 
pt) At (10). (3.6.1) 


Lemme 3.6.3. Pour tout intervalle de temps Ja, b], —oo < a < b < +0, la 
probabilité pour qu'il se produise une infinité de tops dans Ja, b] est nulle. 
Démonstration. Si, avec une probabilité égale à 1, il y avait une infinité de tops 
dans ja, b], alors, avec une probabilité égale à 1, il y aurait une infinité de tops 
dans l’un au moins des intervalles Ja, cl, ]c, b], avec c = (a + b)/2, disons dans 
Je, c]. En vertu de (2), avec une probabilité égale à 1, il y aurait une infinité de 
tops dans |c,b]. Par dichotomies successives, on voit qu'avec une probabilité 
égale à 1, chaque point de ]a, b] serait point d'accumulation d’instants-r, donc 
pour tout À > 0, on aurait P(h) = 1, en contradiction avec (4). [ 


Lemme 3.6.4. Le nombre N(t) de tops se produisant dans [0,é] suit la loi de 
Poisson de paramètre Àt. 
Démonstration. Partageons l'intervalle {0,é] en n intervalles partiels égaux, 
au moyen des points de subdvision : à := 0, 4 := t/n, ta := 2t/n, …. , 
ti = (nr — 1}t/n, t, := t. Soient I, :=]tr1, 68) le ième intervalle partiel 
et Xx le nombre de tops se produisant dans 14 (1 < k < n). D’après (3), 
les variables aléatoires X4 sont indépendantes, prenant des valeurs entières 
positives. De plus, d'après (2), elles sont identiquement distribuées. 
Associons à l'intervalle 74 la variable aléatoire Y, définie par Y4 := I{x,>1}. 
Les Ÿ, sont des variables aléatoires de Bernoulli, indépendantes, identiquement 
distribuées, de loi commune {1 p{t/n}}eo+p(t/n)e1. Posons 5, := Y1+...+ 
Yn. On à naturellement $, < N(t). En général, $, < N(t}, mais, pour n 
suffisamment grand, on peut s'attendre à ce que $, = N(t). En fait, nous 
montrons que : 


Sn ES NE) (n— +00). (3.6.2) 
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D'après le Lemme 3.6.3, il y a une probabilité nulle pour qu’il se produise 
une infinité de tops dans [0,}; il y a également une probabilité nulle pour 
que deux tops se produisent au même instant. Par conséquent, pour presque 
toute réalisation w du processus, il y a, dans [0,{], seulement un nombre fini 
d’instants-r, tous distincts. On peut donc, pour cette réalisation w, choisir 
un entier ño assez grand pour que, pour tout n > no, chacun des intervalles 


partiels 1, ... , Î, contienne au plus un seul instant-r. Ainsi, pour cette 
réalisation w et pour tout n > n0, on a : Sh(w) = N(t}(w), ce qui entraîne 
(8.6.2). 


Comme la convergence presque sûre entraîne la convergence en loi, on 
a aussi 5, 2 N) {t) (n — +oo). Cette propriété permet de déterminer la 
loi de N(t). En effet, S, est une variable aléatoire binomiale de paramètre 
(n,p(t/n)). On a, d'autre part, p(t/n) — 0 et E[S,] = np{t/n), une quantité 
qui est équivalente à n Àt/n = Àt, d'après (3.6.1). D'où, EfS,] — At. Il 
en résulte que S, converge en loi vers une variable aléatoire de Poisson de 
paramètre Àt. Ainsi, sa limite M(t) suit cette loi de Poisson. [| 


L'hypothèse (2) de stationnarité permet alors de conclure que le nombre de 
tops se produisant dans tout intervalle de longueur t suit une loi de Poisson 
de paramètre Àt. Ceci achève la démonstration du Théorème 3.6.1. 


3.7 COMPLÉMENTS ET EXERCICES 


3.1 Soient {N{t) : t > O0} un processus de Poisson de densité À > 0 et 
Ti l'instant où se produit le premier top. Montrer directement que la loi de 
probabilité de T1, conditionnellement à l'évènement {N(#) = 1}, est la loi 
uniforme sur [0, t]. 


3.2 Des greffons de foie arrivent à un bloc opératoire suivant un processus de 
Poisson de densité À. Deux patients attendent d’être greffés, le premier (resp. 
le second) a une durée de vie qui suit une loi exponentielle de paramètre y 
(resp. 2). Il est entendu que le premier greffon qui arrive au bloc est pour le 
premier patient, s’il est encore en vie, sinon au second, s’il est encore en vie. 


La probabilité que le premier (resp. le second) patient soit greffé est : 
Au + ) À 
(+ p2)(X + pa + pa)” 


+ 
(resp. 


3.3 Les employés d’une entreprise arrivent au travail selon un processus de 
Poisson {N(t) : i > 0} de densité À > 0. Pour & = 1,2,..., soit S; la date 
d'arrivée du #°% employé. 
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(a) Le nombre total des heures de travail effectuées dans l’entreprise jusqu’à 
NO 
la date t > 0 est : X(+t) = Ë (— Si). 


(b) Utiliser la Proposition 3.5.3 pour évaluer E[ oi SIN(t) =]. En 
déduire : E[X(t)] = X42/2. 


3.4 Un compteur reçoit des impulsions selon un processus de Poisson {N(t) : 
+ > 0}, de densité À > 0. On suppose que l'amplitude d’une impulsion décroît 
avec le temps, suivant un taux exponentiel, c’est-à-dire que si une impulsion 
a une amplitude À à la date 0, alors son amplitude à la date # > O est Ae7tt, 
avec & > 0. On suppose, en outre, que les amplitudes initiales des différentes 
impulsions sont indépendantes et suivent toutes la même loi qu’une variable 
aléatoire À, ayant une espérance mathématique E[A] finie. Elles sont, enfin, 
indépendantes du processus {N(#) : & > 0}. On désigne par X1, X2,.….. la suite 
des instants d'arrivée des impulsions et par A1, 42,... la suite des amplitudes 
initiales respectives. Alors l'amplitude totale mesurée à la date t > 0 est 


donnée par 
NE) 
AE) = D Age ax), 
&=1 
Calculer E[A(t) | N(t) = n], puis E[A(t)]. 


3.5 Soit {N(é) : t > 0} un processus de Poisson, de densité À > 0. Calculer 
Cov(N(s), N(t)) pour 8,4 > 0. 


3.6 Un processus de Poisson est localement continu en moyenne quadratique. 


3.7 En tout point t, un processus de Poisson est dérivable en probabilité avec 
dérivée nulle. En revanche, il n’est pas dérivable en moyenne quadratique. 


3.8 Soit {N(t) : £ > 0} un processus de Poisson de densité À > 0 et T 
une variable aléatoire, indépendante de ce processus, de loi exponentielle, de 
paramètre y > 0. On désigne par Z le nombre de tops du processus qui se 
produisent dans l'intervalle aléatoire [0,7]. Déterminer la loi de probabilité 
de Z. (Dans la terminologie de Exercice 3.2, la variable Z est le nombre de 
greffons qui arrivent tant que le premier patient est vivant. La probabilité que 
le premier patient soit greffé est P{Z > 1}.) 


3.9 Soient {W(+) : t > 0} un processus de Poisson de densité À > O0 et Xo une 
variable aléatoire, indépendante de ce processus, de loi dei +€41). On pose 
X() := Xe (—-1}"®. Calculer : 

(a) E[X(t)] > 0); (b) Cov(X(s), X(#)) (0 < 8 < t < +00). 
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3.10 Soit (X1,...,X%) l'échantillon ordonné d’une suite (X1,...,X,) de va- 
riables aléatoires, indépendantes, uniformément distribuées sur [0,t]. D'après 
la Proposition 3.5.3, cet échantillon ordonné a pour densité conjointe n1/#° 
sur l’ensemble {0 < æ1 <-:: < æn <t} et 0 ailleurs. 

(a) Pour 1 < 8 < n, la densité fx;(x<) de XF est donnée par 


( L jante La) (er <t} 


s—i,l;n—s 
et la densité fy.(ys) de Y, :=t— XX par 


n 1 1, n— 
(b) Pour 1 <r < s < n, la densité fx; x:(x7,7) du couple (X*, XX) est 
donnée par : 


n E ar _ 
e 1,s—r—1,1 Je fm) l a)" : 
1 »d, 
(O< x, < xs <t). 
(c) Avec la convention X$ := 0, X#,, := #, pour 0 <r < s <n+1et 
(r,58) # (0,n +1), on pose WU, := XŸ — XŸ. Alors la densité fy,,(u) de Ur,s 
est donnée par : 


n Le _ 
(_, 1 nr)e" TT <u<b. 
(d) La densité de l'étendue X*—X? de l'échantillon {X1,... , Xn) est donnée 
par : 


nn Due —u) (Ü<u<t). 


(e) Toutes les variables aléatoires U,,+41 (0 < r < n) (n > 2) ont même 
densité donnée par 
1 
nu (O<u<t); 
donc même fonction de survie : 


E 
P{U,,r41 > u} = at- u}® (D<u<t). 


3.11 Soit {N(+) : t > O} un processus de Poisson de densité À > 0. Les Tn, 5, 
conservent la même signification que dans tout le chapitre. On suppose qu’un 
top ne peut être enregistré, que si la longueur de l'intervalle de temps, qui le 
sépare du top qui le suit immédiatement, est au moins égale à une certaine 
quantité ! > Q (inertie de l’appareil enregistreur). On désigne par Q(£) le 
nombre de tops survenus dans {0, +] (£ > 0) et qui ont été enregistrés. 

N( 

{a) Pour tout £ > 0, le nombre Q(£) a même loi que w Hr,>n- 
k=1 
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(b) Conditionnellement à l'évènement {N{f} = n}, les variables Ti, ... , Tn 
ont même loi que les variables notées Vo, , Un_1,n dans l'Exercice 3.10 (e}. 


NE 
En déduire l'expression de E[ 32 Zr,say NE) = n]. 
ka 
(c) Calculer E!Q(#)]. Étudier la cas particulier { = 0, 1 = +. 


Chapitre 4 


Applications des processus de Poisson 


Dans ce chapitre, nous nous proposons de donner d’autres propriétés des 
processus de Poisson, ainsi que plusieurs applications. Les notations du 
chapitre précédent sont conservées. En particulier, le processus de Poisson 
est noté {N{#) : # > 0}; de plus, les variables 7, et S, conservent les mêmes 
significations. 


4.1 PROCESSUS DE POISSON MARQUÉS 


On suppose donnés : 

(4) un processus de Poisson {W{t} : t > 0}, de densité À > 0; 

(2) un ensemble fini {1,2,...,r} (r > 2), l'ensemble des types; 

(3) pour tout s > 0, une loi de probabilité g(s) portée par l’ensemble 
{1,2,...,r}, c'est-à-dire la donnée d’une suite (g1(s),...,g-(s)) de nombres 
réels, positifs, tels que g1(s) + --- + g,(s) = 1. 


Si un top du processus de Poisson se produit à l'instant s > 0, alors 
indépendamment de tous les autres tops, on le classe en type 1, 2, ... ,r, 
avec la probabilité g1(s), g(s), ... , gr(s), respectivement. On note Mi(t}, 
Nat), .… , N,(t), le nombre de tops de type 1, 2, ..., r se produisant dans 
[0,#], respectivement. On a naturellement N(t) = N1(4) + No(t) ++. +N,(t). 
Les processus {N;(£) : # > 0} (i=1,2,...,r) sont dits processus marqués (par 
le classement ainsi proposé). Il s’agit de préciser justement ce classement et de 
voir dans quelles conditions les processus marqués ainsi obtenus sont encore 
de Poisson. 
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Proposition 4.1.1. Avec les hypothèses précédentes, pour k1 > 0, ... ,k, > 0 
tels que k+...+k=n,ona: 


P{MA() = ki Ni(t)= ke} 


= P{Mi(t) =... Mt) = & IN) =n} (41.1) 


er (x) 

TR 

Démonstration. Pour le système complet d'évènements {N(t) = n} (n > 0), la 

somme 3 P{Ni(t) = k,...,N,(t) = K,N(E) = n} se réduit au seul terme 
a>0 


pour lequel k; +-::+k, = n, qui est encore égal au membre de droite de 
l'identité (4.14). [] 


La proposition précédente montre que pour aller plus loin dans le calcul 
de la distribution du vecteur (N1(£},...,N.(#)}, il faut connaître la loi de 
probabilité conditionnelle P{:| N(t) = n}. Celle-ci dépend évidemment de la 
procédure de classement des tops. 

Prenons, tout d’abord, r = 2 (types) et pour loi g(s) la loi (constante), 
pe: + geo, qui ne dépend pas de s. Dans ce cas, la loi de probabilité 
conditionnelle P{.| N(t) = n} est simplement la loi binomiale B(n,p). On 
en tire, puisque n = k +1, 


k+E 
PAM = &,Ma(0) = 1} = (' M fe Le“ es ñ 


2 exp Qtp}* ea Ca)! : 


k! ü 
On en déduit les lois marginales, qui valent 


PEN) = #8} = SC P{M(E = &, Nat) = 1} = 0, 
1>0 ° 


PE = 0 = SPENCER Na = 07 = ee 
k>0 . 


ce qui montre que Mit) et No(f) suivent des lois de Poisson de paramètres 
Àtp, tq. 

Finalement, P{N;(t) = k, No(t) = 1} = P{Ni(t) = k}P{No(t) = {}, ce qui 
montre que les processus {NV (#) : £ > 0} et {N(t) : t > 0} sont indépendants. 
Le théorème suivant a donc été établi. 


Théorème 4.1.2. Si chaque top d'un processus de Poisson de densité À est 
classé en type 1 ou 2, avec les probabilités p et q, indépendamment des autres 
tops, alors les processus marqués {Ni(t) : t > 0} des tops de type 1 et 
{N2() :t2> 0} des tops de type 2 sont eux-mêmes des processus de Poisson, 
indépendants, de densités respectives Àp et Àq. 


Le Théorème 4.1.2 admet la généralisation suivante dont nous laissons la 
démonstration au lecteur. 
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Théorème 4.1.3. Soient {N(t) : t > 0} un processus de Poisson de densité 
À > Oeir un entier tel que r > 2. Supposons qu'à chaque instant où un 
top arrive, on le classe en top de type 1, ... , de type r, avec les probabilités 
respectives pi, ... , Pr (pa +: +p = 1), indépendamment des autres tops. 
Alors les processus marqués {Ni(t) : t > 0}, ... , {N;{t) : & > 0} sont encore 
des processus de Poisson, de densités respectives Api, ... , Àp+. Îls sont, en 
outre, indépendants. 


Exemples 

(1) Le nombre d'objets produits par une machine-outil peut être considéré 
comme un processus de Poisson {N(t) : t > 0}, de densité À > 0. Ces objets 
sont produits indépendamment les uns des autres et la probabilité pour qu’un 
objet soit défectueux est p (0 < p < 1). Alors le nombre d'objets défectueux 
produits par la machine-outil est un processus de Poisson de densité Àp > 0. 
De façon analogue, le nombre d'objets conformes produits par la machine 
est un processus de Poisson de densité Ag > 0 et ces deux processus sont 
indépendants. 


(2) Soit N{t) le nombre de sinistres enregistrés par une compagnie 
d'assurance durant l'intervalle de temps [0,4]. Le processus {N(t) : t > 0} 
peut être considéré comme un processus de Poisson de densité À > 0. Sup- 
posons que chaque sinistre est classé en l’une des deux catégories (types) : 

type 1 : le coût du sinistre est supérieur à 5.000 euros; 

type 2 : le coût du sinistre est au plus égal à 5.000 euros. 
Supposons, en outre, que la proportion des sinistres de type 1 est p (0 < p < 1), 
celle des sinistres de type 2, g = 1 — p et que les sinistres soient indépendants 
les uns des autres, Désignons par Ni(t), No(t) le nombre des sinistres de 
type 1 et 2 dans l'intervalle de temps [0, #], respectivement. Alors les processus 
{N1(#) : #4 > 0} et {Na(t) : t > 0} sont des processus de Poisson indépendants, 
de densités respectives Àp, Àg. 

(3) Dans Pexemple précédent, au lieu de ne considérer que deux types, on 
peut imaginer que la compagnie d’assurance classe chaque sinistre en type 1, 
2,... avec les probabilités p1, pr, .. (les p; étant positifs et de somme 1), 
ceci indépendamment des autres sinistres. Pour chaque & > 1, désignons par 
Ng(t) le nombre de sinistres de type & durant [0,#]. Si, pour tout t > 0, on 
suppose que le nombre total de sinistres dans l'intervalle de temps [0,4] est 
une variable aléatoire de Poisson de paramètre Àf, on peut utiliser le résultat 
du Théorème 4.1.3. 


(4) Précisons le classement des sinistres de la façon suivante : on dit qu’un 
sinistre est de type k, si son coût est égal à & unités de monnaie. Alors 


N(f = > Nat) est le nombre total de sinistres durant {0,t]; 
k>1 

S{t}= DCEN(E) est le coût total des sinistres durant [0,f]. 
k>1 
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On peut imaginer une autre expression pour le coût total des sinistres : dans 
l'intervalle [0,4] se produisent N(é) sinistres, qui coûtent X1, X2, ..., Xxvç) 
unités de monnaie, respectivement. Le coût total de ces sinistres est donc 
S'(t) = X1 +: + Xwç. Supposons que les coûts X; sont des variables 
aléatoires, équidistribuées, de loi Yyprsr et que (N(t), X1, X2,...) est une 
suite de variables aléatoires indépendantes, la variable N(t) suivant la loi de 
Poisson de paramètre A, Chaque variable X; est ainsi interprétée comme 
le coût d'un sinistre non personnalisé. Sous ces hypothèses, on a le résultat 
remarquable suivant. 


Théorème 4.1.4. Les deux sommes S(t} et S’(t) ont même loi de probabilité. 
L'expression de S'(t) montre que cette loi est une loi de Poisson composée. 
Démonstration. Notons Gx{u) := Y pru* la fonction génératrice de cha- 
#>1 

que X:. Par ailleurs, les variables N(t) et Nx(t} ont pour fonctions génératrices 
respectives : Gnçj(u) = ex, Gnwte) = eptlu-1), 

Comme Gynço(u) = EfutWMt)] = G Nat) (u*), la fonction génératrice de 
S(t) est égale à 


Gsotu) = [I Gao tu) = IT Exco(e#) = exp(xt Eat” — 1)) 


ko k>1 
= epA(E peu —1)} = exp(t(Gx(u) — 1)) 
= Gr © Gxu), 


qui est précisément la fonction génératrice de S'(t). [] 


4.2 PROCESSUS DE POISSON MARQUÉS NON HOMOGÈNES 


On reprend les mêmes notations que dans le paragraphe précédent, mais on 
étudie le cas général où la fonction g(s) n’est plus constante. On suppose, 
toutefois, que r est égal à 2, de sorte que, pour tout s > O, la loi de 
probabilité g(s) est complètement déterminée par g1(s). Ainsi gi(s) (resp. 
1—g1(s)) est la probabilité qu'un top se produisant à l'instant s soit classé en 
type 1 (resp. en type 2). On suppose, en outre, que la fonction g1 : R+ — [0,1] 
est intégrable sur tout intervalle borné. 

D’après le Théorème 3.5.1, on sait que conditionnellement à l'évènement 
{N(t) = n}, les instants S1, ... , S, où se produisent les n tops sont 
indépendants et uniformément répartis sur [0,#. Pour décrire que le classe- 
ment d’un top en type 1 ou 2 se fait indépendamment de tous les autres tops, 
on introduit une suite (Y1,... , YA) de variables aléatoires toutes uniformément 
réparties sur [0, 1] et on fait l'hypothèse que, conditionnellement à {N(t) = n}, 
la suite (91, Y1,..., Sn, Ya} est formée de variables indépendantes. Ensuite, on 
donne au top se produisant en S; Île type 1, si et seulement si Y; < g1 0 Si. 
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Montrons que l’on réalise ainsi le classement voulu, c’est-à-dire, 
PH<nosis=s}=Erénes,|S = 5] = (5). (4.2.1) 
En effet, 
Elricoos. |Si = 8] = Lvencor frastyts) dy, 


où fra (y 8) est la densité de Y; liée par {5; = s}, qui est la même que la 
densité de Y;, à savoir la densité uniforme sur [0,1], puisqu'on a supposé S; et 
Y; indépendantes. De là, 


1 g1(s) 
Elyignos,} Si = s] = [ Lysoi(s)} a= | dy=g(s) D 


Théorème 4.2.1. Soit t > 0 fisé; conditionnellement à l'évènement {N(t) = 
n}, la variable aléatoire Ni(t) suit une loi binomiale de paramètre (n,p), où 


p= cl gs) ds. (4.2.2) 


De plus, pour tout t > O0, les variables aléatoires Ni(t) et Not) sont 
indépendantes et suivent une loi de Poisson de paramètres respectifs Atp et 
A1 — p). 

Démonstration. En effet, 


El{riggs.}l = fEltorenesy LS: = 8] fs.(s) ds, 


où fs,(s) est la densité de $; conditionnellement à {N(t) = n}, c'est-à-dire la 
densité de la loi uniforme sur {0,t]. De là, d’après (4.2.1), 


1 1 fé 
Elivisnes] = L'Elrcmess PS: = 817 Toag(s) ds = :[ gifs) ds. 


Or, conditionnellement à {N{t) = n}, la variable aléatoire Mi(t) a même loi 
que la somme des n variables de Bernoulli, indépendantes : 


mises} ++ fr emos}. 
C’est donc bien une variable aléatoire binomiale de paramètre {n, p). On refait 
alors le même calcul que dans la démonstration du Théorème 4.1.2, pour 
conclure. [ 


Application 1. On suppose que des clients arrivent dans un magasin selon 
un processus de Poisson de densité À > 0, que, dès leur arrivée, les clients 
sont servis immédiatement, qu'enfin les temps de service sont des variables 
aléatoires indépendantes admettant toutes la même fonction de répartition F. 
On demande 

{a) la loi de probabilité du nombre de clients servis jusqu’à l'instant # 
{inclus} ; 

{b) la loi de probabilité du nombre de clients dont le service n’est pas 
achevé à l’instant £. 
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On peut proposer la solution suivante : convenons d'appeler un client de 
type 1 ou de type 2, selon que son service est achevé ou non à l'instant À et 
désignons par Mi(t), Not), le nombre de clients de type 1, 2, arrivés dans le 
magasin dans l’intervalle [O, t]. 

Un client arrivant à l'instant s € [0,é] est de type 1, si son temps de service 
est au plus égal à £ — s; la probabilité d’un tel évènement est F(t— s). Un 
client arrivant à l'instant s € |0,f] est de type 2, si son temps de service est 
supérieur à # — s; la probabilité d’un tel évènement est 1 — F{t—s). 

D'après le théorème précédent, le nombre N(#) de clients de type 1 servis 
à l'instant t est une variable aléatoire de Poisson de paramètre Xp avec 

+ + 
p= :/ F(é-s)ds= :/ F(u) du, 
tJa t Jo 
et l’on a: 


EI (O] = Mp = à [ *Ftu) du. 


De même, No(t) est une variable aléatoire de Poisson de paramètre At(1 — p) 
et en outre N1(#) et No(t) sont indépendants. 


Application 2. On suppose que des immigrants arrivent dans un camp de 
transit selon un processus de Poisson de densité À > 0, que le temps de 
séjour d’un immigrant dans le camp cst une variable aléatoire de fonction 
de répartition F et que ces temps de séjour sont des variables aléatoires 
indépendantes. On désigne par Ni(t) le nombre d’immigrants qui ont quitté 
le camp avant l'instant # et par No(t) le nombre d'immigrants présents dans 
le camp à l'instant £. Alors Nift) et No(t) sont des variables aléatoires dont 
les lois de probabilité sont données par l'Application 1. 


4.3 SOMME DE DEUX PROCESSUS DE POISSON 


Définition 4.3.1. Étant donnés deux processus de Poisson indépendants {N(e) : 
4> 0} et {No(t) : t > 0}, de densités respectives M, }2, on appelle somme de 
ces deux processus, le processus {N(t) : t > 0}, défini par N(t} = Ni(t)+ Not) 
pour tout # > 0. 

Proposition 4.3.1. Le processus-somme {N(t) : t > 0} est un processus de 
Poisson de densité \1 + 2. 

Démonstration. En effet, les variables Ni(t) et Not) sont des variables 
aléatoires de Poisson, indépendantes, de paramètres respectifs At et }2t. D'où 
N(t} est une variable aléatoire de Poisson de paramètre (A1 + ot. Ù 


Remarque 1. Si Tr et To) désignent les temps d’attente du premier top dans 
chacun des processus, le temps d’attente du premier top dans le processus- 
somme est T() = min(r, TU), Comme les variables To et TE) sont 
indépendantes, exponentielles de paramètres respectifs A et As, le temps 


4.4 Processus de Poisson composés 53 


d'attente TU) suit une loi exponentielle de paramètre (Ai + }2), comme on 
peut le vérifier directement. 


Remarque 2. La probabilité pour que le premier top du processus-somme soit 
un top du processus N1(#) est donné par P{ri) < Ti) }, qui vaut À1/(A1+h0), 
compte-tenu de la remarque précédente (cf. [FF1], chap. 12, $4, Exemple 2). 
On peut donc construire le processus N1(+) à partir du processus M({) par le 
procédé du théorème précédent, en prenant p = À1/{Ai + À). 
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Définition 4.4.1. Soit (X,) (n > 1} une suite de variables aléatoires, indépen- 
dantes, identiquement distribuées ; soit {N(t) : t > 0} un processus de Poisson, 
de densité À > 0, indépendant de la suite (X,) (n > 1). Pour tout £ > O0, on 
pose : 

N() 


S(t) = D Xx. (44.1) 
k=t 


Le processus {S(t) : t > 0} est alors appelé processus de Poisson composé. 


Exemple. On suppose que des clients entrent dans un grand magasin selon un 
processus de Poisson {W(t) : t > 0} de densité À. On suppose, de plus, que 
les montants X, (n > 1} des dépenses faites par chaque client forment une 
suite de variables aléatoires indépendantes et identiquement distribuées. On 
suppose, en outre, que la suite (X,) (r > 1} est indépendante du processus 
{N(t} : t > 0}. Avec les notations précédentes, S(t) est le montant des 
dépenses faites dans le magasin dans l'intervalle [0, 4]. 


Le processus de Poisson composé S(t) avait déjà été rencontré dans le 
Théorème 4.1.4, où il avait été noté S'(t) et où les variables X; étaient 
supposées à valeurs dans N. Pour obtenir une information sur la loi de S{t), 
lorsque les variables X; sont quelconques, on détermine la fonction carac- 
téristique de S(t), au lieu de sa fonction génératrice. 


Théorème 4.4.1. Soit (u) la fonction caractéristique commune des X,, soit 
Gnçw(u) la fonction génératrice de N(t). Alors la fonction caractéristique de 
S(t) est donnée par : 


pstylu) = En 0 plu) = XD, 


Démonstration. En effet, 
psçotu) = Efei"50] = E[E(#"50 | N(#)]] 
= DES NE) = nJPLN( = n} 


n>0 
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= DENT HAVE) EN (6) = nIPEN(EO = n} 


n>0 
= DEL tH40) | Ne) = nP{N(E) = n}. 
n30 
D'où, puisque W{#) est indépendant de (X1,...,Xx), 
esou) = XL E + HADIPEN(E) = n} 
n>0 
= XGU) PINCE) = n} = Gre(vlu)) = Ge op). [I 
n>0 


En dérivant, on en tire : E[S(t)] = AE[X], Var S(t) = AtE[X?]. 


Remarque. Chacun des processus {N(t} : £ > 0}, {No(t) : t > 0}, décrit 
dans le Théorème 4.2.1, peut être interprété comme un processus de Pois- 


son composé. Montrons-le pour Mi(t) := bi Jk, où les 7, sont des varia- 


bles de Bernoulli, indépendantes, de loi commune qeo + per, elles-mêmes 
indépendantes du processus { Ni(t) : t > 0}. 

En effet, conditionnellement à {N({t) = n}, la variable aléatoire N(t} est 
binomiale de paramètres (n,p). La fonction génératrice Gyç(u) de Ni(t) 
vaut donc : 


Gmto(u) = Ençy(u) o Ga, (u) = MP D tte D. [] 


4.5 PROCESSUS DE POISSON ET FONCTIONS GAMMA ET 
BÊTA 


On rappelle (cf. [FF1], chap. 15, $3, Exemple 3) que si (X,Y) est un couple 
de variables aléatoires de densité conjointe f(x, y}, la variable aléatoire 


X 
v=dg à Y #0; 
0, siY=0; 
a une densité de probabilité donnée par 


+00 
nu) = [7° lvl fCuv,v)do (u ER). 


On reprend les notations utilisées dans ce chapitre et le précédent pour un 
processus de Poisson de densité À > 0 : les 5, (n > 1) sont les instants ou 
se produisent les tops, T1 = $1 est le temps d’attente du premier top et Tr 
(n > 2} est le temps séparant le (n — 1)" top du n°%, On pose So = 0 et 
Pon a: 8, = T+:..+7 (n > 1). On a déjà vérifié que $, suivait une loi 
gamma de paramètre (n, À) (cf. Théorème 3.2.2). 
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Considérons le rapport U(r,s) = —_. (r,s > 0). Comme 0 <S,< 8,4, 
+ 


+ 
on a 0 < U(r,s) < 1; de plus, U(r,s) est le rapport d’une variable aléatoire 
de loi l'(r, À} et d’une variable aléatoire de loi T'{r + s, À). Ces deux variables 
aléatoires ne sont pas indépendantes. Pourtant la variable aléatoire U(r,s) a 
une loi de probabilité qu’on peut calculer et qui ne dépend pas de À, comme 
le montre le théorème suivant. 


Théorème 4.5.1. La variable U(r,s) = _ (r,8 > 0) suit la loi béta de 


ps 

première espèce Bir,s), dont la densité est donnée par : 
1 ri 1 

1-u) O<u<l) 

Ha" "tu Ou 


(cf. [FF1}, chap. 14, 8 9.) 

Démonstration. Posons $,4, = S, + 9% où 5° = Tr} + -:- + T,+,, de sorte 
que les variables aléatoires $, et S° sont indépendantes, de lois respectives 
Tr, À) et Ts, À) et de densités respectives fr, À,x) et f(s,À,y). La densité 
du couple (8,,5%) est donc f(r,À,z)f(s, À,y) sur R+ x R+. Posons u = x et 
v = x +, de sorte que (5,,8,,,) = (uo(5,,8!},u o (8,,5!)). La densité du 
couple (S,, 8744) vaut donc 


fn aquo)) (eau 0) ED 
JA 01 Tea wo 0) 
CON LED) ENT en CEE Le 
Ne Per SE ms CES 


si 0 < & < v et 0 autrement. 
La densité (u) de U(r,s) vaut donc G si u € [0,1] et lorsque u € [0,1] 


h(u) = [unten En du 
= xt RICE [evura 
= Lt f ete ts qu {avec Àv = 1] 
re + 


Considérons maintenant deux processus de Poisson, indépendants, res- 
pectivement de densités À et ps (À,u > 0), que l’on étudie à partir de l'instant 0. 
Les instants où se produisent les tops dans le processus de densité 4 sont 
notés 51,5%,... On pose, de plus, 7} = $%, — $_1 (n > 1) avec Sf = 0. Les 
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deux processus étant indépendants, les suites (5,) et (7) sont elles aussi 
indépendantes. Dans le théorème suivant, on détermine la loi du rapport 


V(rs)= È {r,s > 0). 
Ô 


Théorème 4.5.2. La variable aléatoire V(r,s) = & (r,s > 0) suit une loi 
bêta de seconde espèce, dont la densité est donnée par 
1 Xpsur 1 | 
HD > 0: 
no = Froocrme %v20 
0, ailleurs. 


Démonstration. La densité f(x,4) du couple (8, S) est donnée par le produit 


RON 

DA es Trent pour x et y positifs et 
r—i)l(s—1)! 

Ÿ ailleurs. 


On a donc h{v) = 0 pour v < 0; pour v > 0, on obtient : 
+00 
h(v) = [ u f{uv,u) du 
( 


opte Xasur 1 +00 Don) rs 
=/ Fe < WT du 


des densités, c’est-à-dire, par e 


= y vw l + 4 +81 = 
MCE TEEN Ed Î e ET dt  [u(Av+uw) =] 
1 x sal 
- ü 


4.6 ABANDON DE L'HYPOTHÈSE DES ACCROISSEMENTS 
STATIONNAIRES 


On étudie maintenant un modèle de processus, où la densité À dépend du 
temps. Les axiomes qui avaient été énoncés pour les processus de Poisson à 
accroissements stationnaires sont remplacés par les suivants. 


Définition 4.6.1. Soit À une fonction réelle continue définie sur R}. Le processus 
de comptage {N{t) : t > 0} est appelé processus de Poisson de fonction de 
densité X(t), s’il satisfait les axiomes suivants. 

(a) N(O) = 0; 

(b}) Le processus est à accroissements indépendants. 

(c) Soit mt) = f À(u) du; alors pour tout couple (s,t) tel que 0 < s < 
t < +oo, le nombre N(t) — N(s) de tops situés dans ]s,t| est une variable 
aléatoire de Poisson de paramètre 


€ 
a(s,4) = mt) —m(s) = [xt du 
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Comme N(t) est une variable de Poisson de paramètre m(t), on a : 
mé) =E[N(E)], mé) = Var N(E). 


Pour cette raison, m{f) est appelée la fonction moyenne du processus ou 
fonction de renouvellement. C’est une fonction définie pour & > 0, à valeurs 
positives, croissante, continue et dérivable pour & > 0, sa dérivée étant A(t). 
En outre, m(0) = 0. On suppose que m(t) tend vers l'infini avec t. 

Notons encore les ordres de grandeur suivants, pour À > 0 : 


P{N(E+R)— N(E) = 1} = (mé + h) — mft)je-(mtrh)-mte)) 
= NA Jh + o(h) ; 
P{N(E+ À) — N(t) > 2} = 1 — CRIME) (1 (mé + R) — m(t)) 


= UE à {ue = oh). 


Proposition 4.6.1. Tout processus de Poisson, non à accroissements station- 
naires, peut se ramener à un processus à accroissements stafionnaires par un 
changement d'horloge. 

Démonstration. Soit {N(t) : t > Q} un processus de Poisson, non à accroisse- 
ments stationnaires, de fonction de densité À(£), supposée strictement positive 
pour tout # > 0. La fonction de renouvellement mt) = f A(u) du corres- 
pondante est alors une fonction continue, strictement croissante, nulle pour 
t= 0 et qui tend vers l’infini lorsque t tend vers l'infini. Elle admet donc une 
fonction inverse m1. Posons N*{t) = N(m-1l{t)). Le processus de comptage 
{N*{t) : t > 0} est un processus de Poisson, à accroissements stationnaires, 
de densité À = 1, puisque N*(f) est une variable aléatoire de Poisson de 
paramètre m{m°1l(t)) =é. !{] 


Donnons quelques propriétés des processus de Poisson non à accroissements 
stationnaires. 


Propriété 4.6.2. Soit t un point de discontinuité du processus. Avec une 
probabilité égale à 1, l'amplitude du saut en t est égale à 1. 

Démonstration. Soit £ > 0 et soit L l'intervalle |£ — ,t + «].En notant AN. le 
nombre de tops situés dans L, on à : 

P{N>1} 

PEN. 21} 

LL 1—ertmitte)-mlée) (| + m(é+e) — mt e)) 

—_ — e-(m(éte)-m(t-e)) 


P{N>1[N>l}= 


= 2e À(t)+ ae), 


qui tend vers 0, lorsque £ tend vers 0. [ 
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Propriété 4.6.3. Pour 0 < s < t < +00, la probabilité qu'il se produise une 
infinité de tops dans ]s,t] est nulle, ou encore, avec probabilité égale à 1, la 
suite des points de discontinuité du processus n'admet pas de point d’adhérence 
à distance finie. 

Démonstration. En effet, 


P{N(E) — N(s) < +00} = Y° e-tntb-mçn) (m0 mn) =1 


eo na! 
Propriété 4.6.4. La fonction aléatoire N(t) est localement continue en pro- 
babilité en tout point t > 0. 
Démonstration. Soient + > 0 et s > 0 tels que £ — € > 0. Alors 
P{N(t+e)— Nft—e) > 0} = 1 emtte-mline) L'ohfihe, 
qui tend vers 0 avece. [ 
Théorème 4.6.5. Soit 0 < 8 < t < +00. Conditionnellement lorsque N(t) — 
N(s) = n, les n instants tops situés dans |s,t] ont même loi de probabilité 
qu'un n-uple de variables aléatoires indépendantes identiquement distribuées 
mu) — ms) 
mt) — m(s) 
(s <u<t). En d'autres termes, pour 0 < s < 8! < # << +oo, on a : 
PEN(E) — N(s) = KIN(E) — N(s) = n} 


. () eo _ me (1 L_ m{#) - MY 


selon la loi de probabilité de fonction de répartition F(u) = 


mé) — m(s) m(t) — m(s) 
pour k=0,1,...,n. 


La démonstration est analogue à la démonstration qui avait été donnée 
pour les processus à accroïissements stationnaires. 


Donnons maintenant la construction d’un processus de Poisson, non à 
accroissements stationnaires, de fonction de densité X(t). Si cette fonction est 
bornée, ce processus peut être construit à partir d’un processus de Poisson, à 
accroissements stationnaires. Soit À > 0 tel que pour tout £ > O on ait À(£) < À 
et soit {N(#) : t > 0} un processus de Poisson à accroïssements stationnaires 
de densité À. On convient de ce qui suit : si un top de ce processus se produit 
à l'instant s, on le retient avec la probabilité g(s) = A(s)/À et on le rejette 
avec la probabilité 1 — g(s). On désigne par {N1(t) : & > 0} le processus de 
comptage défini par les tops retenus. 

Proposition 4.6.6. Le processus {N1(t) : t > 0} est un processus de Poisson, 
non à accroissements stationnaires, dont la fonction de densité est A{t). 
Démonstration. Ce théorème a, en fait, déjà été démontré, la variable de 
Poisson Ni(t) étant de paramètre Apt = m{t), puisque p est donné par : 


€ Ë 
v=5f deas= à [ X(s) de = mt). 0 
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Nous donnons une seconde définition des processus de Poisson non à 
accroïssements stationnaires. 


Définition 4.6.2. Le processus de comptage {N(f) : { > 0} est appelé processus 
de Poisson de fonction de densité À(t), s'il vérifie : 

a) N(0) =0; 

b) le processus est à accroïissements indépendants ; 

c) pour h|0,on a: P{N(t+h)— N(t) = 1} = À(t) + ofh) et 
P{N(E+h) — N(t) > 2} = o(h). 


Application. Soit (X1, X2,.….. ) une suite de variables aléatoires, indépendantes, 
identiquement distribuées, à valeurs positives, de densité commune f, de 


fonction de répartition commune F. On pose À(t) = ï IQ {taux de 
défaillance commune). On convient d'enregistrer la valeur de la n°" variable 


aléatoire Xn, si Xh > max(X1,..., Xn_1) (Xo = 0) et on désigne par N(t) le 
nombre de valeurs enregistrées et situées dans {0,4]. Dans l’exemple ci-après, 
N(#}(w) = 5. 


x x x x_x x 
Ô 2x1 23 T2o%6 Ta 25 £7 Ë 28 


Proposition 4.6.7. Le processus de comptage {N({t) : t > 0} est un processus 
de Poisson non à accroissements stationnaires, de fonction de densité X(t). 
Démonstration. L’évènement {N(t+h)— N(t) > 1} se réalise, si et seulement 
s’il existe un entier n > 1 tel que les évènements {X, €lt,t + h]} et 
{X1<t,...,Xn1 <t} se réalisent. Par conséquent, 


P{NG+R)— N(t) > 1} = P{UJ{XI St... ,Xu St N{XA eltt+h]}} 


n>1 
= ŸP{XI St... Xn1 S t}P{Xn El + Al} 
n>l 
2 EE PTNE(E+ R) —F() 
n>l 
_ FG+R) -F(+) 
 1-F6) 
Or, ce dernier terme est équivalent à 
CHOSE TE D 
1-F( _ . 


Cas particulier. Supposons que la loi commune des X, soit la loi exponentielle 
de paramètre À > 0. Alors A(t) = f(t)/(1 — F(t)) = Xe-At/e-t = }. Le 
processus {N(4) : £ > 0} est alors un processus de Poisson à accroissements 
stationnaires, de densité À. Le procédé précédent, dit des valeurs saillantes, 
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fournit donc un procédé pour construire un processus à accroissements sta- 


tionnaires à partir d'une suite (X,) de variables aléatoires indépendantes, 
toutes de loi exponentielle de paramètre À. 


4.7 ESTIMATION DE LA DENSITÉ D'UN PROCESSUS DE 
POISSON 


Soit un processus de Poisson {N(i) : # > O0}, de densité À inconnue. On 
se propose d'estimer cette densité à partir d'observations. Donnons deux 
méthodes. 

1} Supposons qu’on observe le processus jusqu’à un instant © > 0. On 
dispose alors des données suivantes : 

a) n, le nombre de tops dans [0,7]; 

b} les instants 21, ... , %n (0 < 21 < æ2 < +. < æn < T), où se sont 
produits les n tops consécutifs dans {0, T1. 
La vraisemblance de ces observations est donnée par 


LÂn,æs,...,tn À) = P{N(T)=n}g(xs,..….,æ | N(T)=n) 


n 
Ten = Me TT (O<ri << <T), 
d'où 
LogL=n Log À — AT 
et 
DlosL= T0 + i=2. 
Ainsi Pestimation par le marimum de vraisemblance est donné par i= n{T. 


<_N(T 
L’estimateur correspondant est obtenu en remplaçant n par N(T) : À = 1Q. 
Proposition 4.7.1. L'estimateur À est non biaisé, exhaustif et complet. 


Démonstration. En effet, EIN] = (1/T)E[N(T)] = (1/T)AT = À. Comme la 
vraisemblance L(æ1,...,Œn; À) est de la forme XeÀ7, l'estimateur est bien 
exhaustif, Enfin, comme N(T) suit une loi de Poisson de paramètre ÀT et que 
la loi de Poisson est complète, l’estimateur À est complet. [] 


Puisque À est non-biaisé, exhaustif, complet, c’est l’unique estimateur non- 
biaisé de variance minimum de À. 


2) Supposons que nous observions le processus jusqu’à l'apparition du 
nième top. Nous disposons alors de la donnée des instants 21, ... , 4h des 
apparitions des tops. La vraisemblance est donnée par : 


PORC ES Jet Jen = Aer AEi++an) 
Log L = n Log À-— X(æ1 +... +2): 
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par suite, 
â n < ñ 
be L= 7 . =0 i- . 
ax 128 3 (ti+. +2) + AT 


En posant S, = X1+:::+ X,, instant d'arrivée du nère top, on voit que 
l'estimateur correspondant est À = n/5,. 


4.8 COMPLÉMENTS ET EXERCICES 


4.1 À raison d’un véhicule toutes les dix secondes en moyenne, le flux des 
véhicules dans une voie donnée comporte une proportion de p = 10 % de 
camions et de 90 % de voitures (particulières). 

(a) Quelle est la probabilité qu’au moins un camion passe dans un intervalle 
d'une minute? 

{b) Sachant que dix camions sont passés dans un intervalle de cinq minutes, 
quel est le nombre moyen de véhicules qui sont passés dans cet intervalle ? 

{e) Trente véhicules sont passés durant dix minutes, quelle est la probabilité 
que trois parmi eux sont des camions ? 


4.2 Des voyageurs transitent à un poste frontière de la Communauté eu- 

ropéenne, les citoyens à un rythme de À par unité de temps, ceux étrangers à 

la Communauté à un rythme de x par unité de temps. À partir d'un instant 

donné, évaluer, en fonction de À et y, la probabilité que le n°" citoyen de la 
Communauté se présente avant le m°°% étranger. [Utiliser l'identité 
r k 4e rent 

Lee fa 

er kl À r! 

que l’on établit immédiatement par intégration par parties.] 


4.3 On reprend les notations du paragraphe 4.3. Soit F la fonction de 
répartition de X;; la puissance n°7° du produit de convolution de F est 
notée F*?, La fonction de répartition de S{t) est donnée par : 
+oo 1 M 
PES) <a} = D F()re Qu). 


r=Ù 


4.4 On reprend les notations du paragraphe 4.4. Soit (X,) (r > 1} une suite 
de variables aléatoires indépendantes, chacune de loi ge _1+pe41. Pour n > 1, 
on pose Y, := Xi +... + X, et Yo := 0. 

(e) On à : P{Yonm = m} = (PT)pttmn  (m > —n). 

(b) Évaluer P{S({t) = m}. 
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(c) Vérifier que X P{S{t)=mN(t)=n}=1. 


4.5 On considère un processus de Poisson {N(t} : £ > 0} de densité À > 0. 
Étudier les processus suivants déduits du processus {N(t) : t > 0} par les 
opérations suivantes. 

(a) On supprime les tops de rang impair. Noter {N1({t) : £ > 0} le processus 
obtenu. h 

{b) Pour tout 4 = 1,2,... on décale l'instant S; d'apparition du &°7° top 
d’une quantité constante a. Noter {N2(4) : 4 > 0} le processus obtenu. 

{c) Pour tout à = 1,2,... on décale l'instant S; d'apparition du #7 top 
d’une quantité aléatoire Y positive dont la densité de probabilité g(x) est 
indépendante de i. [Soient Na(t) le processus résultant et G{t) la fonction de 
répartition de Ÿ. On démontre d’abord que, conditionneltement à l'évènement 
{N(#) = n}, la variable aléatoire N3(t) est binomiale de paramètre (#, p(t)} 
avec 


pt) = af ot-aa, 


puis on calcule P{MNa(t) = k}] 

{d) Soient M, le milieu du segment [S,_1,8,] et V: la longueur du segment 
[Mn-1, Mn]. Calculer les coefficients de corrélation des variables Va_1 et Va, 
puis des variables V,_1 et V:41. Calculer la loi de probabilité de VA. 


4.6 (a) On considère un processus de Poisson {N{(t) : t > G} de densité À > 0. 
Pour tout t > Oet tout entier n > 0, on pose P,(t) := P{N(t) = n}. Pourt > 0 
et n > 1, soit P/(t) la dérivée de P,(t). Alors, P}(t) = —AP,(t) + AP,-1(#). 
De plus, P,(0) = 0 pour n > 1. [Utiliser la Propriété 3.1.3. 

(b) Soit (An) (n > 0) une suite de nombres réels positifs. On considère 
maintenant un processus de comptage {N(t) : & > 0}, à accroissements 
indépendants. On suppose, de plus, que si l'évènement {N(t) = n} est réalisé 
pour un certain n > 0, alors la probabilité qu’il se produise un top dans }f, £+h] 
est égale à Ah +o(h) et la probabilité qu’il se produise au moins deux tops est 
oh). Établir le système différentiel pour la fonction P,(t) := P{N(t) = n} : 


(0 =) Paft) + ni Poilt) (n = 1,2,...); 
6(E) = —ào Po(t). 

{e) Mêmes hypothèses que dans (b). On suppose, de plus, que pour tout 
n>0,onax, =nXet N(0) = no, où À > Oet no > 1. Si N{0) = no = 1, alors 
Pot) = 0 et Pift) = e"X{1 — el)! pour n > 1. La fonction génératrice 
G(s,t) := EJs NO] de N{t} est égale à : sex (1 — 8{1— e7#t}}" 1. [Poser 
Qu(t) := Pa(be"*]] 
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Si N(0) = no > 2, la fonction génératrice de N(t) vaut (G{s,t})"®; d'où 


nl) not Anne Si 
_ > no: 
P,(D = (ne {—-e*) , Sn2>R; 


0, sin <no—l. 


4.7 Processus de naissance et mort 

On considère un processus de Poisson {N(t) : & > 0}, à accroissements 
Stationnaires, de densité À > 0. On interprète l'apparition d’un top comme 
la naissance d'un individu. On suppose, de plus, que chaque individu a une 
durée de vie X et que les durées de vie des différents individus sont des 
variables aléatoires indépendantes, identiquement | distribuées et indépendantes 
du processus. Soient Sy la date de naïssance du KT individu et X4 sa durée 
de vie, de sorte que la date de sa mort sera S4 + X3. On pose So := X0 := 0. 
On désigne par Q(t) le nombre d'individus en vie à la date t. Il s’agit d'évaluer 
la loi de probabilité de Q(t), dans l'hypothèse N(0) = 0. 

(a) Soient r{u) := P{X > u} la fonction de survie de X et 7(t) sa valeur 
moyenne F(é) := (1/4) 6 r(u) du..Si U est une variable aléatoire uniformément 
répartie sur (0, £|, indépendante de X, la fonction de survie de U+X est donnée 
par: P{U+X2>i}=T(t). 

(b) La fonction génératrice h(u) := Efu®4)] de Q(t) est donnée par 
e FL). 

(c) Sous l'hypothèse N{0) = 0, le nombre Q(t) d'individus en vie à la date 
4 > 0 est une variable aléatoire de Poisson de paramètre m{t) = À fé r(u) du. 


4.8 Processus de naissance et mort. Autre modèle 

Soient (An), (Un) (n > 0) deux suites de nombres réels positifs. On considère 
maintenant un processus de comptage {N(t) : & > 0}, à accroissements 
indépendants. On suppose, de plus, que si l'évènement {N(t) = n} est réalisé 
pour un certain n > 0, alors la probabilité qu'il se produise un op positif 
(ou une naissance) dans ]t,t + h] est égale à Ah + o(h). Si {N(t) = n} est 
réalisé pour un certain n > 1, la probabilité qu’il se produise un top négatif 
(ou une mort) est égale à u,h + o(h). Enfin, la probabilité qu'il se produise 
au moins deux tops (positifs et/ou négatifs) est o(h). Le nombre N{t) est égal 
au nombre de naissances diminué du nombre de morts dans l'intervalle [0, é]. 
On suppose que N(0) = no > 1. 

(a) En posant P,(t) := P{N(t) =n},ona: 


Paft+h) = Pat) = Anh — pnh) + Àn-1hPa-1(à) + Hn41hkPni(t) + o(R), 
pourn2>l; 
Pott+h) = (1 — 0h) Pot) + m1hPi(t) + o(h). 
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(b) On en déduit : 
Pt) = — (An + in) Pat) + An-1Pa-1(#) + n41Pai(e) (m2 1) 
Fit) = — do Po(t) + p1 PE) 
Pa(0) = Énng- 
(c) On prend le cas particulier À, = nÀ et p, = ny (n > 0), où À > O et 
u > 0 et on désigne par G(s,t) := E[sN()] la fonction génératrice de N(t). 
Alors G(s,t} satisfait l'équation aux dérivées partielles : 
2G(s,t) 8G(s,t} 


= (}s- _ DIET 2 go 
ET] (is — )(s —1) 35 G(s,0) = 870. 
On peut la résoudre et trouver : 
{as = nje tn) — yfs — 1) \no 
Gt) = Ga — pet) — (8 — 5) 


Chapitre 5 


Chaînes de Markov 


Les chaînes de Markov constituent l'exemple le plus simple des processus 
stochastiques, lorsque dans l'étude d’une suite de variables aléatoires, on 
abandonne l'hypothèse d'indépendance. Il s’agit d'un processus à temps discret 
— d’où le nom de «chaîne ». Il y a les chaînes de Markov dont l’ensemble des 
états est continu — leur étude n'est pas abordée ici — et les chaînes dont 
l’ensemble des états est discret. Celles-ci font l'objet du présent chapitre et 
du suivant. L'ensemble Æ des états est donc soit N, soit une partie finie de 
celui-ci. 


5.1 DÉFINITION ET PREMIÈRES PROPRIÉTÉS 


Soit (X}) (r > 0) une suite de variables aléatoires à valeurs dans l’ensemble E 
des états, supposé égal à N. On dit que cette suite est une chaîne de Markou, si 
pour tout n > 1et toute suite (50, sin 1: 5, 3) d'éléments de Æ, pour laquelle 
la probabilité P{Xo=io,.…, Xn-1=n1, Xn =i} est strictement positive, on 
a la relation suivante entre probabilités conditionnelles : 
P{Xn41= 5 | Xo io, , Xn1=én 1, Xacti} 

= P{Xau = 5lXn=i. (611) 

Autrement dit, dans l'évolution au cours du temps, l'état du processus à 


l'instant (n + 1) ne dépend que de celui à l'instant n précédent, mais non 
de ses états antérieurs. Le processus est sans mémoire où non héréditaire. 
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Définition 5.1.1. La chaîne de Markov est dite homogène (dans le temps), si la 
probabilité précédente ne dépend pas de n. Soit 


Pij = P{Xn1 = j|Xn =i} (n>0) (5.1.2) 


cette probabilité; on Pappelle la probabilité de passage de l’état à à l’état j, en 
une étape, ou en une opération, ou encore, en une transition. 


Définition 5.1.2. La matrice 


Po,o Po Paz 
P=|P10 Pi Pair 


dont les coefficients sont les probabilités de transition p;; est appelée ma- 
trice de passage (ou de transition) de la chaîne. C’est une matrice finie ou 
dénombrable, suivant que l’ensemble des états est fini ou dénombrable. 


Propriété 5.1.1. Toute matrice de transition P = (p:,;) ((i,5) € E?) vérifie 
des propriétés suivantes : 

(1) pour tout couple (1,5), on a : pij > 0; 

(2) pour toutie E, on a X pi = 1. 

3€E 

Démonstration. Les nombres p;; sont des probabilités, donc des nombres 
positifs. Par ailleurs, pour chaque à € E, l'application B + PS définit 
une mesure de probabilité sur E. [ 


Remarque. Une matrice P, qui vérifie les conditions (1} et (2) de la propriété 
précédente, est appelée matrice stochastique. stochastique (matrice) 


Propriété 5.1.2. Soit P une matrice de transition. Alors 

(1} P admet la valeur propre 1 ; 

(2} on peut associer à cette valeur propre le vecteur propre V ayant toutes 
ses composantes égales à 1. 


Démonstration. En effet, en considérant V comme un vecteur-colonne, on a : 
PV = V si et seulement si, pour tout à € E,, la relation suivante est satisfaite : 
D pi, v5 = w. I suffit donc, pour tout à € E, de prendre; :=1. [] 

jeE 


Graphe associé à une matrice de transition. À toute matrice de transition, on 
peut associer son graphe. Les sommets du graphe sont les différents états de 
la chaîne. Il y a une flèche, étiquetée p;,;, entre le sommet étiqueté & et le 
sommet étiqueté j si et seulement si la probabilité de transition de l’état à à 
l'état j est strictement positive : pi,; > 0. 

Lorsque l’ensemble des états est fini, cette présentation de la matrice de 
transition par son graphe est particulièrement utile et parlante. 
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5.2 EXEMPLES DE CHAÎNES DE MARKOV 


Il y a des modèles classiques de chaînes de Markov homogènes, souvent 
rencontrés, avec lesquels il est bon de se familiariser dès le début. En voici 
quelques-uns. 


5.2.1 La chaîne à deux états 


En excluant le cas trivial de la matrice-unité, la matrice de transition corre- 
spondante est de la forme 


pete 7) (0<a,B<1). 


Les calculs sont explicites. Pour tout # > 0, on peut évaluer la nième puissance 
P*, ainsi que la valeur limite lim, P* (cf. Exercices 1 et 2}. 


Le graphe associé est très simple : 
1 a 2 
1-afCi T7 *L1-6 


5.2.2 Le modèle de diffusion d'Ehrenfest 


Deux urnes À et B contiennent, à elles deux, a boules, numérotées de 1 à a. 
À chaque instant, on choisit un nombre de 1 à a, avec une probabilité 1/a. Si 
ce nombre est i, on change d’urne la boule numérotée #. 

L'ensemble des états est l’ensemble E = {0,1,...,a}. Le processus est 
dit être dans l’état j si l’urne À contient j boules. Dans ces conditions, si le 
processus est dans l'état 0 (l’urne À est vide) (resp. l’état a, à savoir l’urne B 
est vide), la probabilité est égale à 1 qu’il passe dans l’état 1 (resp. l'état 
(a—1)). La matrice de transtion est donc donnée par 


0 1! 0 0 De 0 0 © 
t/a O0 (a—l)a 0 … O0 00 
0 2/a 0 (a—2}/a … 0 0 0 
0 0 0 0 (a —1)/a 0 1/a 

. 0 1 0 


0 0 0 0 

et le graphe associé par : 
3ja 22 9ja 81 j/a 2 
a. . +. 


+ Le Le 
(a-2)/a (a-1}/a 1 


Pour n > 0, désignons par X, le nombre de boules dans l’une À à 
l'instant n. Si Xo = @, alors le processus (X,) (n > 0) décrit la «diffusion » 
d’un gaz de À vers B. 
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5.2.3 Promenade au hasard sur Z (Lord Rayleigh) 


Considérons une chaîne de Markov, homogène dans le temps, caractérisée par 
l’ensemble des états E := Z = {0,41,+2,...} et la matrice de transition 
P = (pi,5) (à, € Z), avec, pour tout (1,7) € Æ, 


P, sij=i+l; 
Pij=(l-r, sf=i-l; 
0, dans les autres cas; 


où p est un nombre fixé tel que 0 < p < 1. Un tel processus est appelé 
promenade aléatoire sur Z. Son graphe peut être décrit comme suit : 


5.2.4 Le modèle de la ruine du joueur 


Un joueur À joue contre un joueur B une suite de parties de «pile» ou 
{face», indépendantes. La somme totale de leurs fortunes est de a euros. À 
chaque partie, on convient que le joueur À gagne un euro (que lui donne le 
joueur B) avec une probabilité p et perd un euro (qu’il rend donc à B) avec 
une probabilité g (0 < p < 1; g = 1—p). Le jeu s'arrête dès que lun des 
joueurs est ruiné. 

Pour chaque n > 0, on désigne par X, la fortune du joueur À à l'issue de la 


rËèME partie. La suite (Xh) (n > 0) est une chaîne de Markov, dont l’ensemble 


des états est E := {0,1,...,a}. Sa matrice de transition est donnée par 
100...000 
g0p...000 

P=liiit. ! 

000... 
000... 

et son graphe par : 

OUR Tr te a ‘a ti 


Les états 0 (ruine de À) et a (ruine de B) sont dits absorbants. 


5.2.5 Le modèle de bonus-malus 


Une compagnie d'assurances classe les niveaux de bonus-malus de ses clients 
suivant les entiers naturels : 0,1,2,... Le niveau 0 est le plus avantageux pour 
l'assuré. Soit O < à < j. Si le niveau de bonus-malus de celui-ci à l’instant n 
est à, son niveau à l'instant suivant (n +1) est j si entre les deux instants il a 
eu (j — à) accidents. Il ne rétrogradera jamais! On désigne par (X,) (nr > 0) 
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la suite des niveaux de bonus-malus qu’un assuré donné parcourt au cours du 
temps. 

Convenons, d'autre part, que l’unité de temps est l’année et que le nombre 
d'accidents provoqués par l'assuré en une année suit la loi de Poisson de 
paramètre À. Alors la probabilité que l'assuré passe du niveau À au niveau j 
avec j > 4 est égale à 7a,5-: := e À Xi/(j — à)! 

D'après ces hypothèses, la suite (XA) (n > 0) est une chaîne de Markov, 
dont l'ensemble des états est E = N, la matrice de transition est triangulaire 
supérieure, donnée par 


TA0 F1 FA2 ++ 
0 m0 Fa... 
P=10 0 FAO « 


Son graphe est le suivant : 


L2 L2 Li L] 
FAD LP w 282 
o 1 78 2 8 


5.2.6 Évolution déterministe 


À toute application f d’un ensemble E fini ou dénombrable dans lui-même, 
on peut faire correspondre une matrice de transition P; = (p:,;) ((à,5) € E?) 
définie par : 

mou {r SOS 

0, autrement. 

Si f, g sont deux applications de E dans F, la matrice de transition Pc 
associée à f o g n’est autre que le produit matriciel P;P,. En particulier, 
Pr = (Pr}". 

La suite des ensembles E, f(E), f?(E), ... est décroissante pour la relation 
d'inclusion. Lorsque E est fini, il existe En C E tel que f"(E) = Éo à partir 
d'un certain rang et la restriction de f à l'ensemble Eo est une permutation 
de Æ5. Comme on peut décomposer cette permutation en cycles disjoints 
ÆEo = C1+:::+ Cr, l'ensemble E lui-même, se partitionne en orbites disjointes 
E = Oi+::+07, avec C; € Os pouri = 1,...,r. À partir d’un certainrangn, 
l'élément f"(e) parcourt donc l’un des cycles C4. 

Si (Xn) (n > 0) est une suite de variables aléatoires, ayant Æ pour 
ensemble d'états et P; pour matrice de transition. Le comportement purement 
déterministe de la chaîne est complètement décrit par la suite {Pyn) (n > 0). 
En particulier, asymptotiquement, la chaîne a un comportement périodique, 
elle reste dans l’un des cycles Ci. Cette évolution déterministe donne une 
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idée des phénomènes de périodicité que l’on rencontre dans les processus de 
Markov plus généraux. 

Le graphe associé à P; n’est autre que le graphe usuel associé à l’applica- 
tion f (cf. Exercice 5.4). Notons que si £ est fini et si f est une permutation 
de E, la matrice P; est une matrice dite de permutation, qui n'a que des 0 et 
des 1, avec un et un seul 1 dans chaque ligne et dans chaque colonne. 


5.3 LA RELATION DE CHAPMAN-KOLMOGOROV 


On a coutume d'appeler ainsi la propriété qui relie, pour une chaîne de Markov 
homogène, les probabilités de transition en # étapes aux probabilités en une 
seule étape. On conserve les notations des paragraphes précédents : (X,) 
{r > 0} est une chaîne de Markov homogène, dont l’ensemble des états est E 
et la matrice de transition P = (p;,;) ((é,5) € E?). Pour n >0eti,j € E,on 
désigne par pi la probabilité, partant de l’état 4 en l'instant 0, d’être dans 
l’état j en l’ instant n; en d’autres termes, on pose : 


RD = P{X = j| Xo = 5. (5.3.1) 
On pose également : P() := @?) (GE A). 


Théorème 5.3.1 (Relation de Chapman-Kolmogorov). Pour tout n > 0, la 
matrice de transition en n étapes est égale à la puissance n°" de la matrice 
de transition en une étape : 


PC 2 (Py. 
Démonstration. Le résultat est vrai pour n = 0 puisque P° = J (la matrice- 
identité) et pour » = 1, puisque PO = P. Supposons n > 2; par récurrence, 
pr = prip = plr-DpÜ), Par conséquent, si l'on désigne par pr, le 
coefficient en (, j) de la matrice P*, on a : 


= Done pes 


kEE 
= YU P{Xn 1 = | Xo = 5} P{X1 = 5 | Xo = k} 
keE 
= PEXu = k|Xo = i} P{Xu = jXaui = #} 
ReE [car la chaîne est homogène.] 
Considérons l'évènement A(i,...,in_2) := {Xi = d1,..., Xn2 = in-2}. 


Alors 

PEXa = 5 Xa1 = k} = P{Xn = SI Xnei = K, A(in ina), Xo = i}, 
car la chaîne est de Markov et 

PXna = kfXo=i}= D P{Xu ik, Afin... ins) | Xo = t}, 


sin 2 
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puisque les évènements A{i1,...,t_2) forment un système complet d’évène- 
ments, On en tire : 


Pie D D P{Xn-1 = R Ai. sôn-2) | Xo = à} 
FER Berne x P{Xn = 5 Xn1 = E} 
SN D P{Xn = k Afin, in2)| Xo = i} 
PR  X Pan = 5 Xnc © KA. vin-2), Xo = à} 
SN DP{Xn= ji Xnn = k, Afin... ina) | Xo = à} 
REE à ,.in2 
=P{X=5jlXo= = nf). O 


Corollaire 5.3.2. Pour tout n > 0, la matrice PU) est stochastique. 
Démonstration. En effet, pour tout € E; on a : 
Sn? = SU P{X=ilXo=i=L | 
jeE jeE 
Ainsi, pour tout n > 1 fixé, la suite (Xnm) (m > 0) est une chaîne de 
Markov, ayant même ensemble d'états E et dont la matrice de transition est 
P*. 
Corollaire 5.3.3, Pour tout (à, j) € E? et tout couple (m,n) d'entiers positifs, 
on a l'identité : 
P{Xmtn = 51 Xo = 5} = D P{Xm = k| Xo = i} PLXn = 51 Xo = k}, 
keE 


pe 2 ST D pe, (5.3.2) 
kEE 


Où encore 


Démonstration. Cette identité résulte immédiatement de l’associativité du 
produit matriciel : PÜrHR) 2 pmte 2 pape L pim}p(n) [] 
Proposition 5.3.4. Soient n > 0, r > 1 deux entiers. Alors 
PÉXn4 = nat eee Ant © Jatr | Xo = dos... , Xn = in} 
= Pinnti Pintidnt2 °°" Pintroidntrs (53.8) 
Démonstration. Lorsque r = 1, l'identité (5.3.3) se réduit à (5.1.1). Il suffit 
donc de procéder par récurrence sur r. Pour r > 2, posons : 
A1 := {Xo = i0,..., Xn = in}; 
A2: {Xn41 = fnt1se 
A3 = {Xntr = fntr}. 
D’après (5.1.1), on à : P(43/A142) = pins de plus, P(42! A1) = 


Pins Pintifere <* Dintr-insn-1s PAT récurrence sur r. On conclut alors, en 
utilisant l'identité : P(A243 | A1) = P(43| 4142) P(A2} A1). 


nr © fntre1}s 
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5.4 MESURE DE PROBABILITÉ D'UNE CHAÎNE DE MARKOV 


Soit (X:) (n > 0) une chaîne de Markov, homogène, admettant l’ensemble FE, 

fini ou dénombrable, comme ensemble des états et la matrice P = (p:;) 

{({G,3) € E?) comme matrice de transition. Supposons, de plus, donnée une 

mesure de probabilité 4 sur E, autrement dit, une suite (4) (à € E) de 

nombres positifs tels que Y 47 = 1. Le but de ce paragraphe est de montrer 
iE 


# 
que la matrice de transition P et la mesure de probabilité & permettent de 
définir une mesure de probabilité P sur l'espace probabilisable (Q, 21) sur lequel 
sont définies les variables X,. 


5.4.1 Mesure de probabilité et loi initiale 


Définition 5.4.1. On dit que P est la mesure de probabilité de cette chaîne, si 
les propriétés suivantes sont vérifiées : 

G) pour tout état 5, on à : P{Xo = i} = w:; on dit alors que y: est la loi 
initiale de la chaîne; 

(ä) pour tout couple (4, j) d'états, on a: P{X, = j| Xo =} = pig. 

Dans ces conditions, l'évaluation suivante résulte de la Proposition 5.3.4, 
formule (5.3.3), pourn =0etr2>1: 


P{Xo = io, X1 = fn... Xy = jr} 
= P{Xo = 0} P{Xi = fn... Xe = je | Xo = to} 
= Ho Po. **" Pierre (54.1) 


On note aussi P# cette mesure de probabilité de la chaîne, lorsque l’on veut 
faire ressortir la dépendance de P de la loi initiale y. 


5.4.2 Le processus canonique 


Considérons l’ensemble E\ des suites infinies dont les termes sont pris dans un 
ensemble dénombrable E. Pour n = 0,1,..., la niè"® projection de EN sur E 
est définie comme l'application X, qui envoie l'élément w = (io, i1,... ;ns...) 
sur Xn(w) = in. 

Pour décrire une chaîne de Markov qui possède la mesure de probabi- 
lité P#, on prend pour { l'ensemble EŸ, pour suite (X,) (n > 0) la suite 
des projections, pour tribu % la tribu engendrée par tous les X, (ef. 81.12), 
c’est-à-dire la tribu engendrée par les évènements de la forme {X, = D. On 
peut montrer alors qu’il existe une et une seule loi de probabilité P := P# 
sur (Q, À) telle que les relations (5.4.1) soient satisfaites. (Voir [FF1], chap. 10, 
Exercices 1-6, pour une démonstration dans le cas où E est fini.) Le processus 

| ainsi construit sur EN est dit canonique. 


5.4.3 Formules de conditionnement 


Dans les énoncés suivants, À désigne un évènement appartenant à la tribu 
Aa (nr > 0), une tribu qui est engendrée par le vecteur (X0,...,X3). Comme 
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vu dans la Proposition 1.12.2, l'évènement À est une réunion dénombrable 
d'évènements, disjoints deux à deux, de la forme {Xo = i0,..., Xn = in}. 
L'évènement {4,X, = i} est alors un évènement de la tribu Un. S’il n’est pas 
vide, on a forcément À C {XA =i}; le «présent» {X, = i} est donc fixé. 


Proposition 5.4.1. Soient n > 0 et À un évènement appartenant à la tribu 
Un. Si P{A,Xn=i}>0, ona: 


PÉXnt1 = A Xn Si} = PÉXnH = 5 Xn = Ë} = pis. (5.4.2) 


Démonstration. Pour n = 0, la probabilité conditionnelle dans (5.4.2) n’est 
définie que pour À = {X0 = i} et dans ce cas elle vaut p;,5, si P{Xo = i} > 0. 
On dit qu’un évènement À, appartenant à la tribu A, à la propriété (H} si 
P{A, Xn =} > 0 et si la relation (5.4.2) est satisfaite. Considérons une suite 
d’événèments (A4), disjoints deur à deux, ayant la propriété (H). Alors 


P{Xnh = j, D A Xn = i} = DC PLXn = Ag Xn =} 
k k 
= D PEX au = 51 Ar Xn = 5} P{Ar Xn = i} 
k 
= pi DC P{Ag, Xn = à} = pi PL) Ag, Xn =}. 
k k 


Comme la probabilité P{5, Ar, X, = i} est strictement positive, la réunion 
x 4x a encore la propriété (H). D’après la définition-même (5.1.1) de la 
propriété de Markov, chaque évènement de la forme {X0 = 4 > Ân1 = 
in Xn.= in}, satisfaisant P{Xa = d0,...,Xni = 1, Xa = ins Ân = 
i} > 0 (ce qui implique à, = i), a la propriété (H). Comme tout évènement À 
de %n, tel que P{A,X, = i} > 0, est réunion dénombrable de tels évènements, 
il satisfait aussi la relation (5.4.2). [ 


Remarque. Pour que la propriété (5.1.1) puisse se prolonger à un évènement 
de la tribu ,, comme dans (5.4.2), il faut que le présent soit de la forme 
{Xn = i}, où & est un élément de l’ensemble des états. La formule ne serait 
plus valable, si ce présent était de la forme {X, € B} avec B non-singleton. 

Considérons, en effet, la promenade au hasard sur Z (cf. 5.2.3} avec 
l(e-2 + €2) comme loi initiale. Alors P{Xo = 2, X1 = #1,Xo = 0} = le, 
puis P{Xo = 2,X1 = +1} = lg et P{X: = +1} = h(p+q) = à; enfin 
P{X1 = +1,X2 = 0} = }(p? + q°). On en déduit : P{X2 = 0} Xo = 2, X1 € 
{-1,+1}} = q, alors que P{Xo = 0 X1 € {—-1,+1}} = p°? + q°. Ces deux 
probabilités sont donc différentes si q 2 1,5. 


On peut aussi prolonger la formule (5.4.2), en considérant non plus des 
évènements futurs de la forme {Xh41 = j}, mais des suites finies d'évènements 
ponctuels, tous postérieurs à (n + 1) et obtenir ainsi une extension des 
formules (5.3.3) et (5.4.2). 
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Proposition 5.4.2. Soient n > 0, r > 1 deux entiers et À un évènement 
appartenant à Un. Si P{A,X, =i} >0,ona: 


PEXat1 = nt Xntr = nr | À, Xn = nr} 
(543) 


À Pinn41 Pin+in+e 7 Pintr-idntr 


Démonstration, La démonstration est tout à fait analogue à celle de la Propo- 
sition 5.4.1, en vertu de la Proposition 5.3.4. [ 


Lorsque r = 1, la formule suivante est identique à (5.4.2) ou à (5.4.3). Pour 
r > 2, elle se déduit de cette dernière formule par sommation par rapport à 


Jn+1s ee à fntr1 © 


P{Xn4r = 5] 4 Xn = i} = pl). (5.44) 
En particulier, pour À = {, on obtient : 
P{X rar = 5 Xn = it} = pl), (545) 


ce qui montre que l’homogénéité supposée pour la transition en une étape est 
encore vraie pour les transitions en r étapes. 


Comme le membre de droite de (5.4.3) ne dépend pas de À, on obtient : 


PÉXn41 = nie Xntr © fntr | À, Xn = in} 
= P{Xn4i = fais Xngr © ntr| Xn = ên} 
Æ Pinnta Pintidnte  Pinér-1ntre (5.4.6) 


Pour démontrer, enfin, que la première de ces identités se prolonge à tous les 
éléments de la tribu A:41,%, on procède comme suit. D'abord, la dite identité 
se prolonge à tous les éléments de la tribu An+1n+r engendrée par le vecteur 
(Xa41:...; Xn+4r), puisque tous les éléments de cette tribu sont des réunions 
dénombrables d'évènements de la forme {X,41 = fn+1,..., Xnyr = fn+r} (cf 
Proposition 1.12.1). Autrement dit, pour tout B € A, intr, On à : 


P{B|A,Xa = in} = P{B|Xn = in}. (5.4.7) 


L'identité (5.4.7) est encore valable pour tous les éléments B de l'algèbre 
An+100, définie comme la réunion de toutes les tribus Anyin+r (r > 1). Pour 
démontrer qu’elle est finalement valable pour les éléments de la tribu Ani1,60, 
on utilise l’argument suivant. D'abord, cette tribu est aussi engendrée par 
l'algèbre 4,41. Ensuite, on vérifie que si l'identité (5.4.7) est vraie pour 
les éléments d'une suite monotone d'évènements, elle est aussi vraie pour la 
limite de cette suite, un résultat immédiat à vérifier. L'identité (5.4.7) est donc 
valable pour les éléments d’une classe monotone, qui contient l’algèbre 4, . 
Elle est donc aussi vraie pour les éléments de la tribu engendrée An41,00 (cf. 
[FF1], chap. 2, Proposition 4.2). 
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5.5 CLASSIFICATION DES ÉTATS ; DÉCOMPOSITION EN 
CLASSES 


Les états d’une chaîne de Markov se répartissent en classes que l’on définit à 
partir de la matrice de transition. 


Définition 5.5.1. On dit que l’état j est accessible à partir de l’état ü, ou est 
conséquent de l'état à, s’il existe un entier n > 0 tel que pi? > 0. On écrit : 
dj. 

Propriété 5.5.1. La relation d'accessibilité entre états est réflexive et transi- 
tive. 

Démonstration. Comme ri = P{Xo = i|Xo = i} = 1 pour tout état 5, 


on à bien à + à. Ensuite, si ire let Î + j, alors EvÈ > Cet p? > 0 


pour certains entiers m,n > 0. D'après la relation (5. 3.2), on en tire : 
PV = E ri PQ > > 0 d'otiei. U 
<E 

Propriété 5.5.2. Soient i,j deux états; les deux propriétés suivantes sont 
équivalentes : 

(a) l’état j est accessible à partir de l’état à, soit à re j ; 

(b) le processus, partant de à, passe par j avec une probabilité strictement 
positive. 
Démonstration, D'abord, (a) = (b) est évident. Montrons que (a) = (b). Sous 
l'hypothèse (a), pour tout n > Ü,ona: pi = 0. Soit À l'évènement «le 


processus passe par j». Alors P{A|Xo = i} = P{ EL {Xn = 5}lXo = i} < 
EP =ilXo=il= pr = = 0, d’où la propriété OM 
#20 n>0 


Cd 
Définition 5.5.2. On dit que deux états à et j communiquent et l’on écrit + j, 
si on a à la fois : ü re j et j ri. 


Propriété 5.5.3. La relation de communication entre états est une relation 
d'équivalence. 

Démonstration. Les propriétés de réfiexivité et de transitivité déjà vérifiées 
pour la relation d’accessibilité restent naturellement encore valables pour la 
relation de communication. Enfin, cette dernière relation est symétrique par 
définition-même. {] 


Remarque. En raison du fait que, pour tout à, on a pf) = 1, tout état 
communique avec lui-même. Un état est appelé état de retour, s’il existe n > 1 
tel que Fu M) > 0. Il existe des états à tels que pour tout r > 1 (donc 0 exclu) 


a D) D 


on ait pi; = 0. De tels états sont appelés étafs de non-retour. Par exemple, 
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l'état 1 dans la chaîne de Markov, telle que E = {0,1} et P — ( 0) est un 
état de non-retour. 


Pour la relation de communication, l’ensemble E des états se partitionne en 
classes d'équivalence, disjointes et non vides, dites classes indécomposables. Si 
Ci et C2 sont deux classes distinctes, on peut éventuellement aller, disons, de 
C1 à Co, mais on ne peut alors retourner de C2 à C1. En revanche, tous les 
états d’une même classe communiquent. 

Certaines classes peuvent ne comporter qu’un seul élément; ce sont les 
singletons. Comme exemples, mentionnons : 


un éfat de non-retour à : p£ D = =1 , D = =0pourn2>l; 
D 1 pour n > 1. 


un état absorbant i : po = = 1, P; 
Dans l'exemple juste mentionné, L'état © est absorbant. 


Définition 5.5.3. S'il n’y a qu’une seule classe pour la relation de communica- 
tion, autrement dit, si tous les états communiquent entre eux, la chaîne est 
dite irréductible. 
Exemple 1. Considérons la chaîne de Markov, dont l’ensemble des états est 
Æ = {0,1,2}, la matrice de transition , 
1/4 
1/21/2 0 @ù 
= |1/21/41/4] et le graphe 1213 12, NUS, 
0 1/3 2/3 
Cette chaîne est irréductible. Tous les états communiquent. Bien que 202 = 
p2,0 = 0 et qu’il n’y à donc pas de flèche entre les états Ü et 2, on a, en revanche, 
Go) 
>0. 


Cine jus ou 


pour tout n > 2 et tout couple d'états (à, 5), l'inégalité stricte : pi 


Exemple 2. Considérons la chaîne de Markov, dont l’ensemble des états est 
E = {0,1,2,8}, la matrice de transition 


0 1 
Ro 0 rotor 
P= 14 1/4 1/4 1/4 et le graphe 27: 
0 0 0 1 a 
301 


La chaîne comporte trois classes {0,1}, {2} et {3}. L'état 3 est absorbant, 
l'état 2 n’est plus visité après un certain temps. Dans la terminologie qui est 
développée plus loin, les classes {0,1} et {3} sont récurrentes, la classe {2} 
est transiente. 


5.6 ÉTATS RÉCURRENTS ET TRANSIENTS 


Pour tout état j, désignons par T; le temps d'atteinte de la chaîne (X,) (n > 0) 
dans l'état j à partir de linstant 1. Autrement dit, 


yiæinffn>liXne} (5.6.1) 
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Ce temps d'atteinte est un temps d'arrêt de la chaîne (cf. chap. 2). Rappelons 
que cela signifie que pour tout n > 0, l'évènement {T; = n}, qui est égal à 
{Xi £ j, Xn-1 # 7, Xn = j} ne dépend que de X1, ... , Xn, ce qui est 
vrai. 

Définition 5.6.1 (Loi de probabilité conditionnelle du temps d'atteinte). Pour tout 
couple (i, j} d'états et tout n > 1, on pose : 


LP = P{T=n|Xo=i. (5.6.2) 


Ainsi, F9 (n > 1) est la probabilité pour que le processus, partant de l'état i, 
atteigne NE ’état j, pour la première fois, à l'instant n. Pour tout couple d'états 


(i, 5), on pose, par convention, #9 :=0 


Théorème 5.6.1. Pour tout entier n > 1, on a l’identité : 
—k] 
ny = Dre EVER (5.63) 


Puisque ri) = à; (symbole de Kronecker, qui vaut 1 si i = j et Ü autrement), 


cette identité est encore valable pour n = 0 eti x j. 

Démonstration. Le processus passe de à à j en n étapes si et seulement s’il passe 
de à à j pour la première fois en k étapes (0 < k < n) et s’il passe ensuite de j 
à j en les (n — k) étapes suivantes. Ces chemins, pour JS k distincts, sont 
disjoints et la probabilité d’un chemin pour # fixé est 4? pe #) 


Ce raisonnement intuitif peut être rendu rigoureux de “ façon suivante, 


Comme, pour nr > 1, ai 


Qnsi}= DUT =R Xe) +{T=n}, 

kel 

al 

DP(T=Rk,Xn = i|Xo = à + ff? 
k=1 

LE 


DC P{T; = k|Xo = i} P{Xn = 5|T; = k,Xo = i} 
k=1 +. 


Or, pour 1 < & < n — 1, l'évènement {T; = k,Xo = i} est de la forme 
{A,Xx = j}, où À appartient à A4_; C %x. Par conséquent, 


P{Xn = j1 T3 = &, Xo = i}= P{Xn = i| A Xe = j} = pf7 


on en déduit 
PLXa = j| Xo = à} 


d’après (5.4.4). Comme P{X, = j|Xo = i} = ni? et P{T; = k|Xo=i} = 


119, 1 en résulte 


9 = = S 9 (me Er UE De Pal pe #) D 
k=1 k=0 
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L'identité (5.6.3) permet de déterminer les fi? par récurrence à partir des 
{n), 
piy © 
“ {) 2 0, 


Pis 

#7 = nf) DE Mn > 2). (5.64) 
Posons 

fie PAT, < +00| Xo = à} = D ff). (5.65) 


n>l 
C’est la probabilité pour que le processus, partant de i, passe par j au moins 
une fois au cours du temps; si à = j, le nombre /;; est la probabilité pour 
que le processus, partant de j, retourne en j, au moins une fois au cours du 
temps. 


Définition 5.6.2. On dit que l’état j est récurrent, si f;; = 1. On dit qu'il est 
transient où transitoire, si f;; < 1. 


Théorème 5.6.2 (Critères de récurrence). Un état j est récurrent ou tran- 
sient selon que 


X pf9 = +00, (5.6.6) 
n>0 

où que 
Del < +00. (5.6.7) 
n>0 


Remarque. Ces formules ont une interprétation intuitive : notons N; := 
E Lx, =5 le nombre N retours dans l'état j après l’instant 0. Alors le nombre 


moyen E[N;] = È Pis É ) est infini si et seulement si 3 est récurrent. 


Ilya plusieurs techniques pour démontrer ce théorème. Nous utilisons ici 
la technique des fonctions génératrices, en faisant usage du Lemme d’Abel, 
dont nous rappelons les deux formes (cf., par exemple, [FF1], chap. 9, lemme 
de la Proposition 2.3). 


Lemme 5.6.3 (Lemme d'Abel). 
(1) Si la série de terme général ah converge et a pour somme a, alors 


lim ass =a. 
s—1-0,50 
(2) Si les an sont positifs et si lim Yan s° = à < +00, alors la série de 


51-0150 


terme général ax à pour somme à. 
Afin de démontrer le Théorème 5.6.2, nous considérons les fonctions géné- 


ratrices 
Pje)e= Das, Rite Der, (5.6.8) 


n20 n>0 
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et à l’aide de la relation de récurrence (5.6.3) du Théorème 5.6.1, établissons 
une relation fonctionnelle entre elles. 


On à: 
k 
Bo = 14 Le =i+ Es" D fn? 
n>l nSl O0Sken 
ke k : 
=1+ y s Y ET ? [puisque fs ) 0 
n>0  OSkEn 


= 1+F(s) Pi5(s). 
Lorsque i # j, il vient de même : P,(s) = Fj,j(s) P;5(s). Se rappelant que 


p{ D = G,5, le proposition suivante est démontrée. 


Proposition 5.6.4. On a les identités 
1 


Piste) = ETF OL Pts) = Fe) Piste) GA 5), (6.6.9) 
que l’on peut réunir en une seule formule : 
Pas(s) = 6,5 + Fi(s) Ps(s). (5:6:10) 


Le Théorème 5.6.2 se démontre alors ainsi : supposons j récurrent, soit 


Z {{® = 1. D’après le Lemme d’Abel (1), RE 9 8° = 1 et donc 
n>0 
lim so = 1. D’après (5.6.9), il en résulte “im F5) = +o = 


3—1-0 


mn 0,8 > El = +oo. On peut appliquer alors Be partie (2) du Lemme 
AL D 


d’Abel et conclure que È D = +00. 


Réciproquement, si 7 est transient, soit 2 fs? < 1, suivant la même 


technique, on à in pts) < +00, d'où, par Te Lemme d’Abel {2}, E no < 


+oo. © 


Revenons à l’Exemple 2, 85.5. Le calcul des coefficients diagonaux des 


matrices P' est fee: Pour tout # > 0, on trouve : PQ = el = 1/2, 


D53 qn) = (1/4}° et rh = 1. Les séries Er, DE et End divergent. Les 
états 0, 1, 3 sont récurrents. La série Del converge, l’état 2 est transient. 
Proposition 5.6.5. Tout état de non-retour est transient ; tout état absorbant 
est récurrent. 

Démonstration. Pour un état j de non-retour, on à po = 1sin=0e0 
autrement. La série de terme général p. € j) est évidemment convergente ! L'état 


est donc transient. Pour un état absorbant, tous les termes pi ) 


4 de la série 
valent 1. La série est divergente et l’état est récurrent. [ 
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Proposition 5.6.6. La récurrence est une propriété de classe : si ir j et sii 
est récurrent, alors j est aussi récurrent. 


Démonstration. Comme i- j, on à pin >0etp; 


m1, 2. De là, 
D pfrtnm) > Er pi vi = pe ni Erii =+o. 
a 


On peut donc parier de classe récurrente et de classe transiente. En fait, on 
a une propriété plus forte que celle décrite dans la proposition précédente : il 
suffit que j soit seulement accessible d’un état à récurrent pour que j lui-même 
soit récurrent (cf. Proposition 5.7.4). Terminons ce paragraphe par l'énoncé de 
quelques propriétés sur les états transients et d’une propriété sur les chaînes 
finies. 


(2) > 0 pour certains entiers 


Proposition 5.6.7. Soit j un état transient. Alors, pour tout état à, on a : 


En =s+fs Dr (6.11) 
n>0 n>0 
{) 1 
Pii 7 ; (5:6.12) 
> tes; 
L=p G#i) (5.613) 
a>l fa] 


mn) est convergente et pl? ") 0, 


En particulier, la série de terme général pi} 
lorsque n tend vers l'infini. 
Démonstration. L'identité (5.6.11) découle de l'identité (5.6.10), appliquée 


pour 8 — 1-0 et du Théorème 5.6.2. Comme la série de terme général pi 


converge vers B := È NE on à Jim à Pjj(s) æ fB, par le Lemme d’Abel. 


La série de terme général 1 a pour somme f;; < 1. On à donc aussi 

JB F(s) = fige D'où im Pas(s) = dus + fi Bet D ph = dis + fs < 
DE 

+oco. Les identités (5.6.12) et (5.6.13) sont de banales conséquences de la 

première formule (5.6.11). [| 


Proposition 5.6.8. Si une chaîne de Markov a un nombre fini d'états, elle à 
au moins un état récurrent. 
Démonstration. Soit N le nombre d'états de la chaîne. Pour tout entier n > 0, 


ona XX pi; =N,d'où D X pi EE +co, ce qui, d’après la Propo- 
ISIN R201SÈEN 
sition 5.6.7, serait une contradiction, si tous les états étaient transitoires. [] 


Remarque. La proposition précédente n’est pas vraie si la chaîne a une infinité 
d'états. On peut avoir une chaîne, où fous les états sont transients. C’est le cas, 
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par exemple, de la chaîne ayant E = Z pour ensemble des états et P = (p;,;) 
où pin = 1 et pi; = 0 si j — à 1, pour matrice de transition. 


5.7 LA PROPRIÉTÉ DE MARKOV FORTE 


Récrivons l'identité (5.4.6), se rappelant que À appartient à la tribu A, = 
E(Xo,.…, Xn); en supposant P{A, Xn = in} > 0,ona: 
PÉXn41 = nie Xatr © fntr | A, Xn = in} 

= PÉXn41 = jnttse es Antr © fntr An = in} 

Æ Pénjnt Pintiinte 0 Pintrnsne (6.7.1) 
Cette formule implique, par simple spécialisation des paramètres, à la fois les 
propriétés markovienne et d’homogénéité décrites dans le paragraphe 1. La 
propriété dite de Markov forte consiste à prolonger cette formule, lorsque le 
conditionnement des probabilités ne se fait plus par rapport à un présent fété 
{Xn = in}, mais par rapport à un présent aléatoirement firé {Xr = i}, où T 
est un temps d'arrêt (cf. chap. 2} de la chaîne de Markov. 

Soit T un temps d'arrêt adapté à la suite (X,) (n > 0). Rappelons qu'un 

évènement À appartient à la tribu Ar, s’il a la propriété que, pour tout n > 0, 
l'intersection AN {T = n} appartient à 4, (ef. $2.3). 
Théorème 5.7.1 (Propriété de Markov forte). Soit T un temps d'arrêt, à 
valeurs dans [0,+o], adapté à une chaîne de Markov (X}) {n > 0), dont 
l’ensemble des états est E et la matrice de transition P = (pi) (1,5) € E?). 
Soit À un évènement de la tribu Ar tel que P{T < co, À, Xr = i} > 0. Alors 
on a l'identité : 

P{Xru = ju... Xrar = |T < 00, À, Xr = i} 

=P{Xi= in... X, = j A0 =} 
= Pia Puf 2 Pier (6.7.2) 


Démonstration. En effet, posons 4’ := {T < 00,4, X7 = i}, B:= {Xry1 = 
joe Xrér © rh, puis Ba = {Xnui © fn Ar © je}, pour n > 0. 
Il s’agit de prouver : P(B[A') = pi Pia ++. Pia, Où encore P(4’B) = 
Pia Phaja 22e Pinaie PCA). 


D'abord, 
P(4B)= ŸP{T=n,A,Xr=i,B}= ŸP{T=n,A,Xn=i,Bn} 
n>0 n>0 
= D P{BIT =n, A Xn =} P{T =, A, Xn si}. 
R>0 


En fait, n’interviennent dans la sommation ci-dessus que les termes tels que 
P{T = n,A,Xn = i} > 0 et pour ceux-ci, on peut utiliser l’identité (5.7.1), 
l'évènement {T = n, A} appartenant à 4. 
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On à donc : 

P{B IT = n, À, Xn = i} = P{Bn|Xn = i} 

= Pas ss Nue © fr Xn © À Pig Page + ee Dire 
De là, 
PAIE) = Pi Paie ++ Pis D PAT = 0 A, Xn =} 
n>0 
= Pi,ji Pda ce Pirigr PÂT < 00, À, Xn = à}. 

Par conséquent, P(B| A") = pi, Dj... Pine Ù 

La formule (5.7.2) est particulièrement utile, lorsque l’on prend pour temps 
d’arrêt le temps d'atteinte T; de la chaîne dans l’état j (cf. (5.6.1)). Comme 
X7, = j, la formule (5.7.2) se récrit pour = j : 

P{Xr,u = je. Xryar = fr |T; < 00, A} 

=PXis je, Xe = je Xo = 5} 

Pi Die 0 Pirnrdee (5.7.3) 
On en tire le résultat suivant. 
Coroliaire 5.7.2. Conditionnellement à l'évènement {T; < oo}, la suite trans- 
latée (XT,4r) (r > 0) est une chaîne de Markov, de matrice de transition P et 
d'état initial 3j. De plus, la suite translatée (Xr,+,) (r > 1) est indépendante 
de la tribu Ar. 

Posons 8r {Xi = jn..., Xe =} = {Xmn © fe Xmyar © Jr}. 
L'opérateur 87, est un opérateur de translation, qui fait subir à à chacun des 
indices des X; une translation égale à T;. L'identité (5.7.3) se récrit, avec 
A=9, 

P{ôn Xi due. Xe = je) |T3 < ©} 

=P{Xi=51,...,X, = ÿ|Xo =} (5.74) 

Si B est évènement appartenant à 2, on peut donner un sens à 87, B à l’aide 
du processus canonique décrit dans le paragraphe 5.2 et montrer que l'on a : 
P{ôr, BIT; < ©} = P{B|Xo= j}. (5.7.5) 

Nous nous contentons d'utiliser (5.7.5) pour les seuls évènements {N; = k}, 


où & est un entier positif, fini ou infini et où N; est le nombre de retours dans 
l’état j après l’instant 0, à savoir 
N= xs (5.7.6) 
n>1l 


Le translaté 8r,{N; = k} est obtenu en faisant subir à tous les évènements 
{Xn = j} apparaissant dans la définition de N; la translation 87. On a donc, 


avec 
Nj =} Her {Xn=51} = Lier +=} (7.7) 


n>l 
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la relation : 
ErAN;=Rk}= {NI SR}. (5.7.8) 
La propriété de Markov forte, dans la forme (5.7.5), permet donc d'écrire 
PEN; = KIT; < co} = P{N; = k| Xo = j}. (5.7.9) 


Or, Ni est le nombre de retours en j, après une premier retour en j, soit 


N;= En Lx Ni 5. Comme il ne peut y avoir de retours en j strictement 
n 


avant T;, on a encore 
n=JIEN, sit; <o; 
d 0, sinon. 
D'où P{N; = k +117; < co} = P{N; = k|Xo = j} = PÉ{N; = k} pour k 
entier positif, fini ou infini. 

Prenons 4 = €; comme loi de probabilité initiale (cf. $5.4.1), de sorte que 
P=Pf:= PS, La probabilité f;; = P/{T; < oo} a été considérée en (5.6.5). 
Comme {T; < 6} = {N; > 1}, on en déduit, pour 0 £ & < ce, 

PN;=k+1}= P{N;=k+IN;>1} 
= PIN; = k+1,T; < 00} 
= PH{T; < 00} PAN; = K + 117 < oc} 
= PAM =). 
Comme PÉ{N; = 0} = PÉ{T; = 00} = 1— f;,5, deux cas se présentent : 


(1) ou bien f;; = 1, l'état j est récurrent et alors PI{N; = k} = 0 pour 
tout # < co, ce qui entraîne PI{N; = 0} =1; 


(2) ou bien a:= fj5 < 1, l'état j est transient et PÉ{N; = k} = ak — aëtl 
pour tout &# < oo. Cette dernière propriété entraîne que PS{N; = œ} = 


1- D (1-a)ai =0. 
k<oo 
Ainsi 
j i si P{T; < œ}=1; 
ÉEN, = où = lb ñ 
PU= = {g Rineacr (740) 


On ne peut donc avoir 0 < P{N; = cc} < 1. 
Enfin, comme E[N] = E[X Lx] = À Pi{X = j} = À ri? on 
n>1 n>l nzl 


retrouve bien les critères de récurrence du Théorème 5.6.2 sous l& forme : 
E[W;] = oo si j est récurrent, tandis que E[W;] = f;,5/(1 — f;5) < oo si j est 
transient. Exprimons ces résultats dans un théorème. 

Théorème 5.7.3. Dans une chaîne de Markov homogène, il n'y a que deux 


sortes d'états : les états récurrents et les états transients. Soient j un état 
transient et a := f;; = PÉ{T; < oo} la probabilité d'au moins un retour de la 
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chaîne dans l’état 5. Alors a < 1 et le nombre aléatoire N; de retours de la 
chaîne dans l'état j suit la loi géométrique : 


PÉN;j=k}=(1-a)at  (k>0). 


Terminons ce paragraphe par une extension de la Proposition 5.6.6 sur les 
états récurrents. 


Proposition 5.7.4. Soit j un état récurrent et k £ j tel que j r* k, alors 
k + j, de sorte que k est aussi récurrent et dans la même classe que j. En 
particulier, une chaîne de Markov ne peut aller d'un état récurrent vers un 


état transient. 


{r) 


Démonstration. Supposons que pour n 2 1 on ait p}; > 0. Il s’agit de montrer 


que l’on a pi m) > 0 pour un certain m > 1. Ii suffit de démontrer la propriété 
pour n = 1, soit p;x > 0. Si l'on avait P{X, = j|Xo = k} = po = = 0 
> 1, on aurait P{N; = co! Xo = k} < È, pf) = 0. De R, 


P{N; = 00 | Xo = j} = LP =o|Xo=i} PUR 1—p;x < let 


pour tout m 


j ne serait pas récurrent, contrairement à Phypothèse. [ 


Soit j un état transient. D’après (5.7.10), avec une probabilité égale à 1, il 
existe un entier n9 tel que le processus ne revienne plus en j après l'instant no. 
Si la chaîne de Markov a un nombre fini d'états, elle possède au moins un état 
récurrent, d’après la Proposition 5.6.8. On en déduit donc le résultat suivant. 


Proposition 5.7.5, Soit Rec l’ensemble des états récurrents d’une chaîne de 
Markov finie. Alors, avec une probabilité égale à 1, la chaîne se trouve dans 
Rec au bout d’un temps fini. 


5.8 PÉRIODICITÉ 


H s’agit d'étudier dans quelles conditions le temps qui sépare deux retours 
au même état j est ou n’est pas multiple d’un temps minimum. On introduit 
pour ce faire la notion de période. 


Définition 5.8.1. Soit j un état de retour: on appelle période de j, le p.8.c.d. de 
tous les entiers 7 2 1 pour lesquels p}} ol > 0. On note d{j) la période de j. Si 
d(j) = d > 2, on dit que j est périodique de période d; si d = 1, on dit que j 
est apériodique. Si j est un état de non-retour, à savoir que, pour tout n > 1, 


(er) 


onap}} = 0 (voir $5), on pose d(j) = 


é? 
Théorème 5.8.1. Si i est périodique de période d finie et si i + j, j # i, 
alors j est aussi périodique de période d. La propriété de périodicité est une 
propriété de classe. 
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) 


Démonstration. Si i + j, alors il existe deux entiers n et m tels que pi? > Oet 


Pi, {r) > 0. Comme i est de période d{i} = d, il existe aussi un entier s > 1 telque 


pi? > 6. On a donc pts > po) > 0. Comme 2? >0—= PE) 


BE 
on & aussi : gran) > 0. La période d{j) de j divise donc à la fois m+2s+n 


et m+s+n, donc aussi leur différence s, et en particulier la période d(i) de i. 
De la même façon, on montre que d{i) divise d(5}. Ainsi d{j) = d(i}=d. [] 


> 06, 


Exemple 1. Considérons la chaîne de Markov, à trois états 0, 1, 2, dont 

le graphe associé est donné dans la figure ci-dessous, où toutes les flèches 

présentes correspondent à des probabilités de transition strictement positives. 
0 1 


Nr 


ge 
L'état 0 est de retour; les lacets 0 — 1 -+ 0 et O0 — 1 — 2 — 0 ont pour 
longueurs 2 et 3, respectivement ; leur p.g.c.d. est d = 1; l’état O est donc 
apériodique. Maintenant, la chaîne est irréductible. Les deux autres états 1 et 
2 sont aussi apériodiques, ce que l’on peut aussi vérifier directement. 


Exemple 2. Dans la promenade sur Z décrite dans le paragraphe 2.3, tous Les 
états sont périodiques, de période 2. 
Exemple 3. Considérons la chaîne de Markov, dont l’ensemble des états est 
E = {0,1,2,3}, la matrice de transition 

0 01/21/2 


. . 
100 0 

P= 010 0 et le graphe IX] 
0196 0 vs 


Tous les états communiquent. Il y à donc une seule classe (récurrente). 1l y a 
exactement deux lacets issus de O0 : 0 — 2 — 1 — O et O0 + 3 — 1 — 0, tous 
deux de longueur 3. La classe est donc périodique de période 3. Cette classe 
peut être subdivisée en sous-classes cycliques selon le schéma : 


{} — (0 
NA 
{2,3} 


Si on ordonne les états dans l’ordre 1,0,2,3, la matrice de transition 
devient : 


0 2 3 


o 0 
I 173 
6 0 


Fosse nr 


1 
Ü 
0 
0 


CNRS 


0 (e] 
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Cet exemple rend intuitif le théorème suivant, donné sans démonstration. 


Théorème 5.8.2. Soit C une classe indécomposable, de période d > 2. Il 
existe une partition de C en sous-classes To, T1, ... , Va-1 telles que les 
seules transitions possibles, dans la classe €, soient les transitions allant d'un 
état de l'; à un état de T'iy1 pour i = 0,1,...,d—1, avec la convention que les 
indices i sont pris modulo d. Les sous-classes lo, l'1, ... , Ty-1 sont appelées 
les sous-classes cycliques de la classe indécomposable C. 


Ce théorème prend son importance, si la classe C est récurrente; dans ce 
cas, tout conséquent d’un état de C, situé dans T';, est encore un état de C, 
situé dans l';,1, les indices étant pris modulo d. Le passage de T'; à Ti}: est 
obligatoire, seul reste aléatoire le choix de l’état dans Tir. 


5.9 COMPLÉMENTS ET EXERCICES 


5.1 On considère la chaîne de Markov à deux états, décrite par la matrice de 
transition de l’Exemple 2.1 : 


P-( ) D<as<1. 


(a) Écrire P sous la forme P — SD S-1, où D est la matrice diagonale 
diag(1,1— a — 8) et S une matrice inversible. 
(b) Pour tout nr > 0, évaluer P*, puis limy P*. 


5.2 On reprend les mêmes notations que dans l'Exercice 5.1. 
(a) Soit u une variable et J la matrice-unité. Évaluer le déterminant 
det(] —uP), puis la matrice inverse (7-uP)"1. 
(b) Développer en série la série de puissances, à coefficients matriciels : 
P{u) = E Pru® = (1—uP)"!. Retrouver l’expression de P", puis de la 
n>0 


valeur limite lim, P*. 


À l’aide des deux exercices précédents, on peut donc calculer explicitement 
la matrice de transition en n étapes et déterminer la loi limite, lorsqu’il y 
a deux états. Celle-ci n'existe pas toujours lorsque le nombre d'états a est 
supérieur à 2. Le calcul de la matrice P" peut devenir inextricable pour un 
nombre d'états grand. Déjà, pour a = 3, il y a de nombreux cas à considérer. 
Pour de grandes valeurs de a, les calculs ne sont possibles que si la matrice P à 
de nombreuses symétries ou beaucoup de zéros (matrice creuse). Le prochain 
exercice est consacré à l'étude d’une matrice très particulière d’ordre 3. 
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5.3 Considérons la matrice de transition 


( l-a a 
p-(iie 0 a (O<a<1). 
1/3 1/3 1/3 
(a) Vérifier que 1, a — 1 et È — @ sont valeurs propres de P. 
(b) On suppose a À ë, de sorte que les valeurs propres sont distinctes. 
Vérifier que les vecteurs (1,1,1), (1,—1,0), (3œ,3a,—2) sont des vecteurs 
propres associés, respectivement, aux trois valeurs propres distinctes. 


1 1 3a 
{c) On pose 8 = {1 -1 3a |. La matrice inverse 57! est donnée par : 
1 0 —-2 
1 1 2 2 6a 
7 55 [2 —(2 : 
s 55430 43e L +30) , 


(d) Présenter P? comme un rod de trois matrices et en déduire sa 
valeur, puis celle de lim, P". La première ligne 4 de cette matrice-limite forme 
une loi de probabilité stationnaire (étudiée au chapitre suivant); elle vérifie, 
en effet, l'identité : u P = u. 


5.4 Une fonction f de E = {1,2,...,n} dans lui-même est dite ultimement 
idempotente, si l'on a f" — f"®-1. Se reportant au paragraphe 2.6, caractériser 
limy Pyn. 


Dessiner le graphe associé à la matrice P; avec f donné par 


i 1238456789 
1/7 511976726 


et calculer limy Pyn. 


5.5 Soit (Xh) (n > 0) une chaîne de Markov, de loi initiale 49 et de matrice 
de transition P = (p:,;) (à,5) € E?). 

(à) Pour i € E et n > 0, posons : Pal = P{X, = i} et considérons le 
vecteur-ligne y{r) := (£, u®, me) …). Alors gt) = y(0) pr, 

(b) Pour0<m<neti,je 'E, on a, avec les notations de (5.3.1), 
P{Xm = à, Xn = ÿ} = a gr, 


5.6 On reprend l'étude de la promenade au hasard sur Z, décrite dans le 

paragraphe 2.3, où l’ensemble des états est E = Z et où, un nombre p tel que 

0 < p < 1 étant donné, la matrice de transition P = (p:,;) ((i,5) € Æ?) est 

telle que, pour tout ie Z,onapiin = 1-pii1 = pet pi; =0sifi— 5] #1. 
(a) Ce processus a une seule classe indécomposable. 
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(b) Pour tout ” >0,ona: pet = =0 et ppe) = = (rh p}t. 


(c) On a Ph)  (4p(1i — p))"//rn. [Utiliser la formule de Stirling.] La 


série de terme général pen) est convergente si et seulement si p # & Donc la 


promenade sur Z est récurrente si p = L et transiente si p # à. 
(4) On a : Poo(s) = X ph 82 = (1 4pqs?) V2 (qi 1 p). 
n20 


(e) Notant 1e la probabilité pour que la promenade, partant de 0, 
retourne en O0, pour la première fois à l'instant 2n, évaluer la fonction 
génératrice : Foo(s) := © nv }s2r, Redémontrer le résultat de (c), à savoir 

n>1 


que les états sont récurrents ou transients, si et seulement si p = è oups L 


5.7 Promenade symétrique dans Z‘ (Polyà) 

On appelle ainsi le produit de d (d > 1} promenades symétriques (chacune 
avec le paramètre à) dans Z. Un retour en (0, ,0) € 26, à partir de (0, ,0) 
équivaut à un retour simultané de toutes les d composantes de0eZà0 É A 
Alors la promenade symétrique dans Z% est récurrente si d < 2 et transiente 
si d > 3. En particulier, dans un réseau dans l’espace, si l’on part d’un point, 
il y a une probabilité non-nulle que l’on n'y revienne jamais! 


5.8 Soit (YA) (n > 0) une suite de variables aléatoires, indépendantes, 
identiquement distribuées, de loi commune ge_1+p€4; (0 <p<1,p+q=t1). 
La suite de terme général X, := (Yn + Yay:}/2 (nr > 0) n’est pas une chaîne 
de Markov. 


5.9 Le prix d’un certain produit peut prendre les valeurs 1, 2, 3, 4, 5 selon 
les lois de l'offre et de la demande. Le prix X, à la date n détermine la 
detrnande D, à la date n, selon la relation D, = c— X,, où c est une constante 
supérieure à 5. L'offre C;, à la date n, est donnée par Ch = c—3+Yn, où (YA) 
est une suite de variables aléatoires, indépendantes, identiquement distribuées, 
de loi commune lei +641). Les changements de prix se font selon les règles 


suivantes : 
Xngi — Xn = #1, si Dr — Cn > 0; 
Kaki Xn= 1, si Da - Cu < 0: 
Xau-Xn=0, si Dn-C=0. 
(a) On fixe Xo = io. Alors (Xn) (n > 0) est une chaîne de Markov homogène 
dont l’ensembe des états est E = {1,2,3,4,5}. 
{b) Déterminer la matrice de transition P et trouver la décomposition de 
l’ensemble des états en classes indécomposables, 


Chapitre 6 


Applications des chaînes de Markov 


On donne dans ce chapitre d’autres propriétés sur les chaînes de Markov et la 
description de plusieurs exemples où ce modèle s'avère très fructueux, comme 
celui de la {ruine du joueur» et celui de la diffusion d'Ehrenfest. On aborde 
aussi l'étude des lois de probabilité stationnaires. 


6.1 ENSEMBLES CLOS 


On reprend les mêmes notations que dans le chapitre précédent, où l’on note 
{Xn) (r > 0) une chaîne de Markov homogène, dont l’ensemble des états est E 
et la matrice de transition P = (p;,;) ((6,3) € Æ?). 


Définition 6.1.1. Un ensemble C d'états est dit clos (ou fermé), si pour tout 
ie C'et tout j #C,ona: pi; = 0. 

Proposition 6.1.1. Si C'est un ensemble clos, alors aucun état n'appartenant 
pas à C n'est accessible à pr d’un état de C'; autrement dit, pour tout 
ieC, tout j gC'ettoutn > 1l,ona ph} = = 0. En particulier, pour tout 
ieC,ona: E, pir = 1; ce qui montre que la restriction de la chaîne aux 


seuls états de 6. définit une chaîne de Markov homogène, ayant C comme 
ensemble d'états. 


Démonstration. Pour n >2,1eCetjgC,ona: 
1) L 
2j) = Zrarks + Erarss ). 
keC 
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ss —1 : 
Dans la première somme, re ) est nul, par récurrence; dans la seconde 


(a) 


somme, p:,+ l'est, par définition. D'où pi; = 0 et aussi 


(nr) 
Lou = 
tec 
Tout ensemble réduit à un état absorbant (cf. $ 5.6) est clos. Tout ensemble 
d'états absorbants est aussi clos. 


Proposition 6.1.2. Tout ensemble clos est une réunion de classes indécompo- 
sables. 

Démonstration. Soit i un état d’un ensemble clos C. D’après la Proposi- 
tion 6.1.1, s’il existe n > 1 et un état j tel que a? > 0, alors j € OC. 
Donc C contient tous les états j tels que à + j et par suite toute la classe 
indécomposable à laquelle appartient i. [] 


Remarque 1. La réciproque n’est pas vraie : une réunion de classes indécom- 


posables n’est pas nécessairement close. Par exemple, avec E = {0,1,2,...} 


et le graphe associé 0 ,1LoL... Lt... , Chacun des états est 


transient et forme à lui seul une classe transiente. Aucune de ces classes n'est 
close. 

En revanche, pour tout r > 0, l’ensemble C, := {#,n+1,...}, réunion de 
classes transientes, est néanmoins clos. 


Remarque 2. Une classe indécomposable close peut être ou récurrente ou 
transiente. Par exemple, dans la promenade au hasard sur Z (cf. 85.28), 
il n’y a qu'une seule classe et elle est transiente. 


Proposition 6.1.3. Toute classe récurrente est close. 


Démonstration. Cette proposition résulte de ia Proposition 5.7.4, où l’on a 
démontré que si À est récurrent et si à + j avec j # à, alors j «+5. Soit C 
la classe récurrente qui contient à et j # C. Si l’on avait p;,; > 0, on aurait 
êræ j et donc ÿ r+i, par la Proposition 5.7.4. L'état j appartiendrait à © 
une contradiction. [] 


6.2 TEMPS D'ATTEINTE 
Dans le paragraphe £ 5.6, on à introduit le temps d'atteinte de la chaîne de 
Markov (Xn) (n > 0} dans l’état j, comme étant la variable aléatoire 

Tim inffn>1liXn =} (6.2.1) 


On a posé également FD = = P{T; = n}X0 = i}, une probabilité que l’on 
note également Pi{T; = n}, en prenant, comme loi initiale de la chaîne, la 
loi de probabilité singulière £;. L'espérance mathématique de T; par rapport 
à la loi Pi est notée M,; := E[T;]. C'est le temps d'atteinte moyen dans j à 
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partir de i. Rappelons que l’on a posé fi; := £ 4? , de sorte que si f;; < 1, 
il vient M;,; = +oo et si fi; =1l,ona 


ET] = of, (6.2.2) 
n>l 
une quantité qui peut être finie ou infinie. La quantité M; est appelée £emps 
de retour moyen dans i; l'inverse 1/M;; est la fréquence moyenne de retour 
ent. (Si Mi; = +oo, on pose 1/M,; := 0.) 
Définition 6.2.1. On dit que l'état à est positif, si Mi; < +o et qu'il est nul si 
Mi = +00. 
Nous omettons la démonstration du théorème suivant. ! 
Théorème 6.2.1 (Critère de positivité). Soit à un état; 
si limsup pi > 0, l’état à est positif; 
n=#400 


si lim pi) 


A Pit = 0, l’état à est nul. 


(r) 


Notons que si 4 est transient, on sait que p;; — 0, d’après la Proposi- 


tion 5.6.7. Donc tout état trensient est nul. 

Théorème 6.2.2. La propriété de positivité (de nullité) est une propriété de 
classe. 

Démonstration. Ce théorème est une conséquence du Critère de positivité. En 
effet, si j est un état nul et si ji avec à £ j, il existe des entiers n1, n2 tels 


que pour tout n > 0, on ait fn) >0, pi) >0etp fret) > je) NS pD. 
Alors lim, pi) )=0= lim 2) = = Oet l’état à est mul aussi. 


Si Mi, est fini, on a forcément fi; = 1. Donc tout état positif est récurrent. 
De même, si fi: < 1, on a M4 = +oo; d'où tout état transient est nul. I y à 
donc des classes récurrentes positives, des classes récurrentes nulles et toutes 
les classes transientes sont nulles. En revanche, lorsque l’ensemble des états 
est fini, il n’y a pas de classe récurrente nulle, ou encore il y à identité entre 
états positifs et récurrents, d’une part, et états nuls et transients, d'autre part. 

On peut vérifier cette dernière propriété de la façon suivante. Soit à un état 
récurrent et € la classe (forcément finie) qui le contient. Si C ne contient 
que i, on a pi? = 1, pour tout n > O et à est forcément positif. Si C est 
une classe récurrente nulle et si elle contient au moins deux états, prenons 


j€eC,jÆi Comme pen) > > > po) , en prenant m tel que pin) > 0,on 


en déduit limy pl "= = 0. De même lim, rfi de =0. Or Y pi = = cardC, d'où 
ijec 


lim El = cardC>0, une contradiction. [ 
ijeC 


1 Voir, par exemple, Loëve (Michel). — Probability Theory, I, 4th Edition. — Springer- 
Verlag, New York, 1978, p. 33-36. 
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Théorème 6.2.3. Les temps d'atteinte moyens Mi; vérifient dans [1,+ce] lu 
relation : 
Mi =1+ pie Mage (6.2.3) 
k#i 


Démonstration. On suppose que la chaîne est en à? à l'instant 0 ct on fait 
un conditionnement par rapport à la variable X1. Alors M; = E'[7;) = 
EE T; 1 X1]] = m5 ET Xi = à + LP lA = = kj=m;l+ 


E pie + Mas) = 1+ pis Mes. Ù 
LE] k#j 


On peut récrire (6.2.3) sous forme matricielle comme suit : posons M := 
(Mi), puis notons M & a matrice obtenue de M en remplaçant les coefficients 
diagonaux par 0 et U la matrice dont tous les coefficients sont égaux à 1. Alors 
(6.2.3) se récrit : 

M=U+PMÉ. (6.2.4) 
Si la chaîne de Markov est irréductible et si la seule classe dont elle est formée 
est positive, alors, par définition, tous les coefficients diagonaux M;; sont finis. 
Notons À la matrice diagonale dont les coefficients diagonaux sont les Mi. 
On peut écrire M$ = M — À, d’où 


M=U+P(M-A)}. (6.2.5) 


Théorème 6.2.4. Si la chaîne est irréductible et si la seule classe dont elle 
est formée est positive, alors lu matrice M est à coefficients finis. 

Démonstration. En itérant (6.2.5), on obtient M = U + PM - PA = 
U + P(U + PM — PA) — PA, d'où, puisque PU = U, l’itération M = 


QU + P?M — (P+PÈ)A =... = nU + P°M —(P +... + P')A. Comme 
(P +::.+P?)A est une matrice à coefficients finis, on en “déduit : 
M+(P+-..+P%)A=nU+P'M. (6.2.6) 


En prenant le coefficient diagonal en (i,i), on obtient, pour tout n > 1, 
Videntité : Mis + (pis +: + PP )Mi =n+ Enf? Mi, où encore, pour 
tout n>1, 5 
(piste + )Mis = n + SC PÉD Ms. (6.2.7) 
# 
Soit alors j un état différent de i. Par hypothèse, à «+ j et donc il existe 
no > 1 tel que a := po) > 0. L'identité (6.2.7) pour nr = no donne : 
+oo > (E+pii + ce + PE) Mi = m0 + EnfE) Mui > n0 + a Mji. D'où 
M, est fini et comme et j sont arbitraires, le théorème est démontré. [] 


Corollaire 6.2.5. Soit C une classe positive. Alors tous les coefficients Mi, 
pour à et j dans ©, sont finis. 


6.3 Le modèle de la ruine du joueur 93 


Démonstration. En effet, la classe est forcément récurrente; elle est donc close 
et la restriction de la chaîne aux seuls états de C' est irréductible et formée 
évidemment d’une seule classe positive. [ 


Corollaire 6.2.6. Si une chaîne est irréductible et a un nombre fini d'états, 
alors la matrice M est à coefficients finis. 


Démonstration. La seule classe indécomposable dont la chaîne est formée est 
nécessairement récurrente, donc positive. Le précédent théorème s'applique. 


Î 


Corollaire 6.2.7. Si une chaîne est irréductible et à un nombre fini r d'états 
et si de plus sa matrice de transition P est bistochastique (i.e. la somme des 
coefficients par colonne vaut 1), alors les coefficients diagonaux M; de la 
matrice M sont tous égaux à r. 


Démonstration. En effet, M; = 1+ D pi; My, d'où, en sommant sur i, la 
Éi 
relation Mi; =7+ D pis Ma =7+ > Ma, d'où M, 
î KA À K#5 
j=1,..;r. [0 


= r pour tout 


6.3 LE MODÈLE DE LA RUINE DU JOUEUR 


Ce modèle a été décrit au paragraphe 5.2.4. On reprend les mêmes notations; 
la ‘fortune totale des deux joueurs est a et pour n > 1 on désigne par 
Xn la fortune du joueur À après la #7 partie. La matrice de transition 
P = (pi,5) (0 < i,j < a) est donnée par : poo = Pa = 1 et Piigi = P, 
pin = q (1 < i < a —1), les autres coefficients étant 0. La chaîne a 
deux classes récurrentes {0}, {a} (états absorbants) et une classe transiente 
{1,2,...,a-1}. 

Désignons par 4; la probabilité pour que la chaîne, partant de i, atteigne 
l'état a avant l'état 0 (donc la probabilité de ruine pour le joueur B). Avec 
les notations des temps d'atteinte, @; = P{T, < | Xo = i}, où 


T=inffn>l:Xhæa}, T=inffn>1:X,=0} 
Posons : 
Ti=inffn>2:Xn=a}, T=inffn>2:X,=0} 
D'abord, 
go=0, Ya=l. (6.3.1) 
Le problème de la ruine est déjà résolu pour a = 1! Supposons a > 2 et 


1<i<a—1]. En conditionnant par rapport à l’état à la date 1, on voit que 
les nombres y; vérifient la récurrence : 


pi=pigtvnp (<i<a-l). (6.3.2) 
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Pour bien se convaincre que ce conditionnement est licite, on peut développer 
l'argument suivant. D'abord, 


PET < To, X1 = 0/Xo = i} = mio = 0; 


: , sii=a-—l; 
P{Ta < To, X1 = a| Xo = i} = Pia = {8 autrement. 


Ensuite, pour 1 < j < a — 1, l'évènement {Ts < To, X1 = j} peut s'exprimer 
comme {1+T <1+7%,X1 = j}. On en déduit, en utilisant les formules de 
conditionnement des chaînes de Markov (cf. 8 5.4.3), 
P{Ta < To, X1 = j| Xo = i} 
=P{+T<1+7%,Xi1=5|X0=i} 
= P{T < TX = ÿ Xo =} P{X1 = 5] Xo =}; 
d’où, puisque l'évènement {T < T$} ne dépend que de X2, X3,..., 
P{Ta < To, X3 = 5 | Xo = à} = PL < To Xi = 5} pis 
= P{Ta < Tol Xo = j}Pi5 = pipi. 
Ainsi a 
gi= P{Te < To|Xo=i} = D P{Ta < Ts X1= 5] Xo = i} 
ji 


ai a 
= vins tie Dir 
jai ji 


Soit la formule (6.3.2) annoncée: gi = wi 1g+giup (1<i<a-—1). 


Les formules (6.3.1) et (6.3.2) permettent de donner une forme explicite 
à la probabilité de ruine ÿ;. En effet, pour à = 1,...,a — 1, on en déduit : 


pu — pi = (g/p}(ei — pi) = (a/p} (oi — pi-2) = <= (9/p}{e1 — vo). 
Comme 6 = 0, on obtient, pour à = 2,...,a, la formule 


ap =a(t+(++ (0. (6.3.3) 


D'où, encore pour i=2,...,a, 


ipi si T1; 


une formule qui, pour i = a, donne 1 =, = (1— {g/p}°)/(1— (g/p)) 1, soit 
ei = (1-(a/p}}/(—(a/p)%), lorsque p £ 3 et 1 = aps, soit 41 = 1/a, lorsque 
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p= 4. On en déduit la formule explicite, valable pour & = 0,1,...,a, 


ul 
— #5 SPA; 

gi 1- (5) 

i ip=i 

, P=z 


(6.3.4) 


On trouvera dans le chapitre 9 une autre technique pour aborder ce modèle, 
à l’aide de la théorie des martingales et du théorème d’arrêt. 


6.4 LOIS DE PROBABILITÉ STATIONNAIRES 


Dans ce paragraphe, il est commode de noter les lois de probabilité & sur 
l’ensemble dénombrable Æ comme des vecteurs-lignes u = (uo,w1,...), où 
uw >0et Yu = 1. 

ë 


Définition 6.4.1. Soit u une loi de probabilité sur l’ensemble des états. Elle est 
dite stationnaire, si u = u : P, ou, de façon équivalente, si pour tout j € E, 
of à : 


Du pi. (6.4.1) 


icE 


Uj 


Supposons qu’il existe une loi de probabilité stationnaire u; pour tout n > 0, 
on a aussi : u = u-P". Il en résulte que si on prend « comme loi de probabilité 
initiale (cf. 854.1), soit ®) = x, alors la loi de probabilité de X», qui 
est donnée par af) = (0) Pr, est indépendante de n et égale à {0}, soit 
P{Xn = à} = P{Xo = à} = pl). 

De façon générale, si l’on prend « comme loi de probabilité initiale, la 
chaîne de Markov devient un processus stationnaire, c’est-à-dire, pour tout 
n > 0 et tout & > 0,on a: L(Xn,...,Xnyr) = L(Xo,...,X4). En effet, 
P£Xa = do... Xngx = x} = PÜXu = 0} P{Xnn = à... , Xnpe = 
il Xn = io} 1 pins 2e Pin-auis = P{Xo = io} P{X; = à,...,Xx = 
ä | Xo = to} = P{X0o = t0,..., Xx = 4}, d’après (5.4.7). D'où la terminologie. 


Remarque 1. [| n'existe pas nécessairement de loi de probabilité stationnaire. 
Par exemple, avec E = N et le graphe associé 


obiloL.. Lil... 


le système u; = Ya pi; (à > 0) se réduit à wo = 0, u; = uj_1 (j > 1). Les 
450 


u; sont donc identiquement nuls et u n’est pas une loi de probabilité sur E. 
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Remarque 2. Il peut exister une infinité de lois de probabilité stationnaires. 
Par exemple, dans le modèle de la ruine du joueur (cf. 86.3), on vérifie que, 
pour tout a tel que 0 < a < 1, la loi u = (a,0,...,0,1 — à) est une loi de 
probabilité stationnaire. 


Le problème de l'existence et de l’unicité des solutions du système (6.4.1) a 
été résolu dans le cas fini. Dans le cas infini dénombrable, la situation est plus 
complexe. Nous ne donnerons que quelques indications. Traitons tout d’abord 
le cas fini. 

Dans ce dernier cas, le fait que la matrice de transition est à coefficients 
réels positifs joue un rôle essentiel. Les résultats donnés ci-après reposent sur la 
théorie de Perron-Frobenius des matrices à coefficients positifs. Les résultats 
utiles pour la présente étude sont donnés dans les compléments de ce chapitre. 

Rappelons qu’une suite (a,) (n > 1) de nombres réels converge au sens 
de Cesaro vers a, si la suite des moyennes ((a1 + a2 +---+a.)/n) (n > 1) 
converge vers a, au sens ordinaire. On écrit indifféremment 


€ 
Ana où limc An = &. 


n—+00 


Chacun doit avoir fait dans sa vie l'exercice qui consiste à montrer que si 


Lol Pan p : : 
an — à, alors an —- a, la réciproque n'étant pas vraie. Pour s’en convaincre, 
on prend l'exemple traditionnel : a, = (—1)" 


Lemme 6.4.1. Si le nombre des états est fini, alors Pr -GIr. De plus, la 
matrice IL est stochastique et l'on a : IP = PII = I et I = Il. 
Démonstration. Soit E l’ensemble (fini) des états de la chaîne. La relation 
2 
+ 

+ PD)/n — mg, Où I = (mi) ((i,j) € E?). Ce résultat fait l'objet 
du Théorème C'4, traité dans les compléments. 

Maintenant, pour tout ? € E,on a: Ë Tij = D Emapis + nel + 

EE 


ce + pf9)/n = Emn E (CHECE 40 


PH = pr. p=p. pr. Le résultat s’en déduit en prenant la limite de ces 
deux expressions au sens de Cesaro. [| 


Pr Sr signifie que pour tout couple d'états (i,j) on a : (pi5 +p; 


}/n = lim,l = 1. Ensuite, 


{n) 


Lemme 6.4.2. Si l'état j est transient, alors pour tout i € E, on ap; ; 0, 
d'où mi; = 0. 
Démonstration. D’après la Proposition 5.6.7, on sait que 2 ) 0, d’où 


2) 0. I 


Rernarque. Le précédent lemme est encore vrai lorsque E est infini dénom- 
brable, 
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Lemme 6.4.3. Supposons que la chaîne est irréductible et possède un nombre 
fini d'états. Alors, pour tout couple (i,j) d'états, 


Fij = TE (6.4.2) 

où M, = E'[T;] est le temps de retour moyen de j en j. 

Démonstration, D'après le Corollaire 6.2.5, la matrice M = (Mi,;) ((i,5) € E?) 

est à coefficients finis. Divisons les deux membres de l'identité M + (P + 
+ P*}A = nÙ + P"M, établie dans le Théorème 6.2.4, par n et faisons 

tendre n vers l'infini. On obtient IA = U, soit, pour tout (i,5) € Æ?, la 

relation ti; M, = 1, ou encore ri; = 1/Mj;=:7;>0. fl 


Remarque. Ce lemme est encore vrai dans le cas infini, dérombrable, si le 
processus est irréductible et positif. 


Théorème 6.4.4. Si la chaîne de Markov a un ensemble fini d'états, alors 
(1) (Existence) il existe au moins une loi de probabilité stationnaire; de 
façon précise, à toute loi de probabilité initiale {°), on peut associer une loi 
de probabilité stationnaire donnée par : u = PO) IL 
(2) (Unicité) les trois propriétés suivantes sont équivalentes : 
(a) la loi de probabilité stationnaire est unique; 
{b) pour tout (i,j)€ E? on a: mi; =t;; 
(c} le processus n'admet qu'une seule classe récurrente. 
Si l’une de ces trois propriétés est vérifiée, l'unique loi de probabilité station- 
naire est donnée par u; = 1; (j € E); en outre, cette loi de probabilité est 
portée par l’unique classe récurrente, c'est-à-dire, en désignant par C cette 
classe, on a les équivalences : j eC&æ x; >0 ete mn; =0. 
Démonstration. 
(4) Comme P" < Il, d’après le Lemme 6.4.1, il suffit de vérifier que u u:= 
a) IT est solution de u = u-P. Or, u-P = (WO H)-P = OO (TP) = arr 


(2) (a) = (b}. Supposons que la loi de probabilité stationnaire u = on 
soit unique. Alors elle doit être indépendante de la loi de probabilité initiale 
a(®. En faisant successivement g{®) = {1,0,...,0), ... , g(0) — (0,...,0,1}, 
on voit que l'on a uj = m1,j = T2, = ::", d'où (b). 

(b} = (a). Soit u une loi de probabilité stationnaire; pour tout n > 0, 
elle vérifie u = u P", d’où, en prenant la limite au sens de Cesaro, u = uIl. 
Utilisons maintenant l'hypothèse {b) : pour tout j € E,ona:u; = ," Tij = 

# 
D um = (E w)T; = #j. La loi de probabilité u est unique et pour tout 
icE €E 
JjeEona:u; =; 

(c) = (b). Soit € l’unique classe récurrente et T la réunion des classes 
transientes. Trois cas sont à considérer : 


() # arbitraire, j € T, alors Fel £, = 7j, d'après le Lemme 6.4.2. 
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(ii) à,3 € C, alors D ) ©, x; > 0, car la restriction du processus à la classe C 
est irréductible. On peut donc faire usage du Lemme 6.4.8. 


füieT,jecC, alors pi ) © — 7; > 0, en faisant usage de l'argument 
suivant. Comme 


+4 D (&) 
cu = Loi nf) + D pi? , 
ic ET 
ona: 


1 mt m){1 = cm 
159 = Li En) + 5 ni } 
k=1 k=1 IT 

Fixons m et faisons endres a vers l'infini. D’après le Lemme sai, le membre de 
gauche de la précédente relation tend vers ri,; et la seconde expression entre 
parenthèses tend vers 7:;. D’après le Lemme 6.4.3, la première expression 
entre parenthèses tend vers x; > 0. Comme € et T sont des ensembles finis, 
donc aussi les sommes les concernant, on obtient : 


mise (Dr) + Dm. 
IEC teT 
(mn) 


Faisons alors tendre rm vers l'infini. Comme, pour tout {€ T,ona p;} 
et que les sommes qui interviennent sont sur des ensembles finis, il vient 


— 0 


Tij = 1j > 0. 


{b} = (c). Démontrons (c) = {b). Supposons que le processus admette au 
moins deux classes récurrentes C1, C2. En numérotant les états dans l’ordre 
Cu Co, R := E\ (C1 U C2), les matrices P* (n > 0) et II sont toutes de la 
forme : 


CG GR 
& f5 0 0 
c[e [| s) 
R\O © 0 


On voit que, pour la matrice I, les lignes d'indice dans C1 ne correspondent 
pas avec celles d'indices dans C2. On a donc (b). [] 


Théorème 6.4.5. Considérons une chaîne de Markov irréductible, dont 
l’ensemble E des états est fini. Alors il existe une et une seule loi de probabilité 
stationnaire u donnée, pour touti € E, par : 
1 
Mi 


W=Ti= (6.43) 
Démonstration. Ce théorème résulte du Théorème 6.4.4 et du Lemme 6.4.3. 
On peut aussi en donner la démonstration directe suivante. Reprenons la 
formule (6.2.5), à savoir M = U + P(M -— A), dans laquelle la matrice 
M = (Mi,;) est à coefficients finis, dans laquelle À est la matrice diagonale 
diag(Mi1, Moo,...) et U la matrice dont tous les coefficients sont égaux à 1. 
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On sait qu'il existe une loi de probabilité stationnaire u. Montrons qu’elle 
est unique. À cet effet, multiplions la précédente formule à gauche par u. 
On obtient u M = uU +uP(M — À) = uU +uM — uA, soit uA = 
Gui Minsuo Moo,.….) = uU = (ay tu +, uote) = (1,1,.), 
ou encore, pour tout $ € E, la relation w; = 1/M;:. | 


Remarque. On peut démontrer l’unicité d'une loi de probabilité stationnaire, 
de cette façon, dans le cas d’un processus à une infinité dénombrable d'états, 
à condition qu’il soit irréductible et positif (et non seulement récurrent). 


6.5 INTERPRÉTATION DE LA STATIONNARITÉ 


Introduisons les variables aléatoires suivantes : 
ñ 
Ne Lx 
k=1 
(c’est le nombre de fois que le processus séjourne dans j dans [1,n]) 
. 1 - 
DO TUE 
(c'est la fréquence de séjour dans j dans l’intervalle [1,#]) 
é = pt) 
Ex) = Pig - 
D'où 
ip (= {),, 
ETRGNE ++ pis ÿ 
c’est la fréquence moyenne de séjour dans j durant l'intervalle de temps [1,n|, 
sachant que le processus à débuté en i. 
Le Lemme 6.4.1 s’interprète comme suit : pour tout couple (à,5) € E?, 
ona: 
E'lFa(5)] — 5 (n — +00). 
Ainsi, m;,; est la fréquence asymptotique moyenne de séjour dans j, sachant 
que le processus a débuté en à. La condition (2) (b) du Théorème 6.4.4 signifie 
que cette fréquence ne dépend pas de l’état initial dont le processus est parti. 
L'influence de Pétat initial s’estompe au cours du temps. 
La fin de ce paragraphe est consacrée à une étude partielle de la station- 
narité, lorsque l’ensemble des états est infini dénombrable. Le Lemme 6.4.1 


n’est plus valable. On peut seulement énoncer (sans démonstration) le lemme 
suivant. 


Lemme 6.5.1. On a Pr" ©; Il, lorsque n tend vers l'infini. De plus IT est une 
matrice sous-stochastique, ie. D Tij < 1 pout tout à, et II = HP = PIL 
Il peut même arriver que I = 0, la matrice nulle. C’est le cas, par exemple, 


lorsque tous les états sont transients, puisque pour tout (i,j) on a el — 0, 
d'où ñ;,; = 0. 
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Théorème 6.5.2. Si un processus n’a que des états transients, alors il n'existe 
pas de loi de probabilité stationnaire. 


Démonstration. Supposons qu'il existe u telle que u P = u et donc u P" = w?. 


Alors, pour tout n > 0 et tout état j,ona:u; = };; ur. Comme tous 


les états sont transients, tous les termes pi? tendent vers 0. Comme ensuite 
les termes pi) sont majorés par 1, on obtient : u; = limy};u; pi = 


D Lima wi n° = 0. Tous les u; seraient nuls, ce qui contredirait X;u; =1. [ 


Théorème 6.5.3. Si un processus a au moins un état récurrent positif, alors 
il existe au moins une loi de probabilité stationnaire. En voici une explicite : 
soit à un état récurrent positif, donc satisfaisant Mi; = E'[T] < +00. Pour 
tout état j, on pose 


ETS Hsninen 1]: (6.51) 
n>0 


C'est le nombre moyen de visites dans l'état j entre deux visites dans l'état à. 
Alors u = (u;), avec u; := v;/Mi; (j € E), est une loi de probabilité 
stationnaire. 


Démonstration. La relation (6.5.1) se récrit : 
ED r-snen-1] = D Eten ner 1] 
n>0 n20 
=XPEX = in <T-1}. 
n20 


Si j £i,ona Pi{Xo = 5,0 < T1} — 0 et pour n > 1 on a aussi 
PXa = j,n = Ti} = 0, de sorte que l’on a deux expressions pour ; : 


Vj 


=) P{Xr=in<T}; (6.5.2) 
n>l 

= P{Xr=in<T-t} (6.5.3) 
n>1 


D'autre part, Pi{Xo = i, 0 <T;—1}= 1 et pour n > 1 toutes les probabilités 

Pi{X, = in <T;—1} = 1 sont nulles, de sorte que v; = 1. Comme à est 

récurrent, la relation 1 = fi; = ÿ) P{T; = n} est vérifiée; or, elle peut encore 
nSl 


s'écrire : 1 = 1 = X Pi{X, = i, n < Ti}. Ainsi, (6.5.2) est vraie pour tout 
n>i 


jeE.Onla récit: 
ve Pie 1<B}+ ÈS PAXr = in <T} 
n>2 
=pij + )PAXn=jn<T} 


n>2 
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Maintenant, pour n > 2, 
PXr= ins T}e )PHXnn = kXn= jn ST} 
per 
=DPHAXr= in Ti, Xni = k} 
ki ; 
# x PXu = bn < Ti}. 
Or, l'évènement {n < Ti} = {Xi Æ i,...,Xn_1 5 é} appartient à la tribu 
n-1. En outre, si & est différent de à, on a {n < T}N{Xn 1 = k} # 0, de 


sorte que l’on peut effacer {n < Ti} du conditionnement du terme précédent. 
Ainsi 


Pain <T}= SPEXA = | Xa1 = k} PH Xi = kon < Ti} 


ki 
= pes PXn = kon ST}. 
kAi 
Par suite, | 
Dep +) PAXn= in ST} 
n>2 
= pig + D Dre PXn ui = kon Ti} 
n>2 ki 
= pis + Dre DC Pan =kn<T} 
RFA  n22 
=pist Pr D PXn= bin ST 1} 
ki n>i 
=pijt D RS PRk,j = Y Ve Dh, 
KA F 


D'autre part, dans [0,+oo], on a : 


Due ETS Hcinen-n] =EÂS teeinen-1] 
î j n>0 n>0 j 
SES nen-n] = 2 PAR > n} = ER] = Mi. 
n>0 n>0 
Si à est récurrent positif, alors M; < +oo et on peut poser u; := v;/Mis. Il 
en résulte que u = (u;) (j € Æ) est une loi de probabilité stationnaire. [| 


Théorème 6.5.4. Si le processus a une infinité dénombrable d'états et s'il est 
irréductible et récurrent positif, alors il existe une et une seule loi de probabilité 
stationnaire u = (w;) donnée par w =1/M;;>0(G€E). 

De plus, le nombre moyen v; de visites dans l'état j entre deux visites dans 
l'état à est donné par : v; = M;;/M;;. 
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Démonstration, L'existence d’une telle loi a été établie dans le Théorème 6.5.3. 
Pour établir l’unicité, considérons une loi de probabilité stationnaire u = (ui) 
et utilisons, de nouveau, la relation (6.2.5), à savoir M = U + P(M — A), 
qu’on multiplie à gauche par le vecteur-ligne u. On obtient : &u M = uU + 
{uP){M — 4) = U+u(m— À); soit u À = U, ou encore, pour tout i € E, la 
relation : w; Mi; 

D'après le HÉéorème 6.5.3, pour tout i € EÆ, la loi u = (u;), avec 
uj = v;/M;; (j € E), est une loi de probabilité stationnaire. D'après la 
première partie du présent théorème, on doit donc avoir v;/M;; = 1/Mj, 
donc v; = Mii/M;. 


6.6 ERGODICITÉ 


Le résultat principal, ci-dessous, est donné sans démonstration. En revanche, 
l’étude de l’ergodicité dans le modèle de diffusion d’Ehrenfest est faite très en 
détail. 

Définition 6.6.1. On dit qu’un état est ergodique, s’il est récurrent positif et 
apériodique. 

L'ergodicité est une propriété de ciasse, puisque c’est le cas pour la 
récurrence, la positivité et la périodicité. Une classe contenant un état er- 
godique est dite classe ergodique. Si l’ensemble des états est fini, si le proces- 
sus est irréductible et si la seule classe dont il est formé est apériodique, alors 
cette classe est ergodique. On dit aussi que le processus est ergodique. 


Théorème 6.6.1. Si une chaîne de Markov a un nombre fini d'états et 
si toutes les classes récurrentes sont apériodiques {done ergodiques), alors 


P® = IE, ou encore, pour tout (i,5) € E?, on a : pf) 


jy — Mi. De plus, la 
matrice I = (ri,;) est stochastique et vérifie : TE =TIP = PIL. 

Enfin, si le processus est irréductible et ergodique, pour tout couple (1,5) € 
E?,ona Tijÿ = A > 0. 

Ce théorème, à rapprocher du Lemme 6.4.1, est donné sans démonstration. 
On peut, toutefois, l’établir en utilisant la formule (6.8.2) du Théorème 6.8.3 
ci-après, en remarquant que si le processus est apériodique, la matrice de 
passage n’a pas de valeurs propres de module 1, différentes de 1. 

Gardons les hypothèses de la première partie du Théorème 6.6.1 et 
désignons par p{") la loi de XA. Alors pÜ9 = y0) pr —+ HO TI =: u, lorsque 
n tend vers l'infini et # est une loi de probabilité stationnaire. En d’autres 
termes, la loi de probabilité gt) de X} tend vers une loi de probabilité limite 
u— u@) If, qui est stationnaire. 

Reprenons maintenant les hypothèses de la seconde partie du Lemme. La 
loi Hmite u = p{®)IT = (T1:72,...) ne dépend pas de la loi initiale. Si on 
prend cette loi limite comme loi initiale, le processus devient stationnaire. Il 
en résulte que l’évolution du processus au cours du temps est de plus en plus 
indiscernable d'une évolution stationnaire. 
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Le modèle de diffusion d'Ehrenfest 


Ce modèle à été décrit au paragraphe 5.2.2. Nous conservons les mêmes 
notations. Rappelons que le processus possède (a + 1) états : 0, 1, ... , @; 
de plus, les coefficients p;; de la matrice de transition P sont donnés par : 


k k 
mess (SES); pamsl-e (O<k<a-1}; 
pi 0 l-1 41 


Tous les états communiquent : le processus est donc irréductible; les états 0 
et a sont des barrières réfléchissantes (définition évidente !}. Chaque état est 
périodique, de période 2. Le processus n’est donc pas ergodique. En revanche, 
le Théorème 6.4.5 permet d'affirmer que le processus admet une et une seule 
loi de probabilité stationnaire u = (uo, w1,.… , da) avec u; = 1/M; = 1/E[T]. 
En fait, au lieu de calculer l'espérance mathématique des temps d'atteinte, on 
peut déterminer « directement à partir de sa définition u = u P, c'est-à-dire 
résoudre le système 


a 
= up; (0<j<a), 
i=0 


dont on saïît déjà qu’il a une solution unique, lorsque les u; sont positifs et de 
somme 1. Ce système se récrit : 


u1 Ua—1 
WE =, 
F k-1 1 
w=(1- Jura + un GSkSa-I). 


On calcule successivement u1 = aug, u9 = (a(a -— 1)/2) us, ce qui suggère la 
solution uw = (f) wo (0 < & < a). On vérifie immédiatement, par récurrence 
sur k, que c’est bien, en effet, la solution générale. Comme, par ailleurs, 
on doit avoir 1 = üg + 1 +: + ua = u0((G) + (9) ++: + ()) = wo2°, 
on trouve : u9 = 1/2%. La loi de probabilité stationnaire est donc donnée 
par ur = (1/2*){f) (i = 0,1,...,a); c’est la loi binomiale B(a, à). Pour 
& = 0,1,...,a, on a: Mix = EP[T3] = l/ux = 2*/(). En particulier, 
Mo, = Mao = 2. 

On rappelle que, pour tout n > O, la variable X, est le nombre de boules 
dans l’urne A. Déterminons une relation de récurrence pour les nombres 
Mn := E[X»] (r > 0), une loi initiale ayant été fixée. Comme 


ElXnti — Xal Xn = k] = ElXn4 | Xn =] —# 


=@-DË+@+n(- À -x 


=1-0#, 
a 
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on obtient 
a 
k 
EX — Xl = D P{Xn = #}(i _- 2=) 
k=0 
=1 2 S-xp{x =h=1 2x, 
=1-° n=h}=1- EX 
k=0 
soit 


Mat = Mas Mn. 


Cette relation peut se récrire Mn41 — @/2 = (1— 2/a)(m, — a/2), d'où 


va-5=(t Dm 5) 


ce qui montre que m, tend vers a/2 exponentiellement, une limite qui est 
précisément l'espérance mathématique de la loi de probabilité stationnaire 
B(a, D. Avec €, comme loi initiale et donc E[Xo] = mo = a, on obtient 
a 2\na 
Mn T (1-°) 3 
Dans ce cas et si a > 2, alors m, | a/2, de façon exponentielle. 

Ces résultats peuvent être interprétés comme suit : quel que soit le nombre 
de boules initialement contenues dans l’urne À, après un intervalle de temps 
assez long, la probabilité de trouver k boules dans À est approximativement 
la même que si les a boules avaient été réparties dans les urnes, chacune 
indépendamment avec une probabilité L Pour # grand, on peut approcher la 
loi binomiale par la loi normale. Avec le temps, il y à, à peu près, autant de 
boules dans une urne que dans l’autre. 


6.7 MATRICES BISTOCHASTIQUES 


Une matrice stochastique P est dite bistochastique si sa transposée ?P est 
elle aussi stochastique. Dans une telle matrice, tous les coefficients sont donc 
positifs et les sommes par ligne et par colonne valent 1. 

Si P est bistochastique et n > O0, alors P" est aussi bistochastique et de 
mème la matrice (P +... + P")/n. Ces deux propriétés sont immédiates à 
vérifier. De même, il est banal de remarquer que toute matrice de permutation 
est bistochastique et par conséquent toute combinaison linéaire convexe d’un 
ensemble fini de matrices de permutations (de même ordre) est bistochastique. 
La réciproque est aussi vraie : toute matrice bistochastique est combinaison 
linéaire convexe de matrices de permutations, une propriété plus difficile à 
vérifier. 


Théorème 6.7.1. Considérons une chaîne de Markov homogène, dont l’en- 
semble des états est E = {1,2,...,r} et la matrice de transition P est 
supposée bistochastique. Si la chaîne admet une seule classe récurrente, elle 
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est nécessairement irréductible. Elle admet, en outre, une et une seule loi de 
probabilité stationnaire u = (u,...,u) donnée, pour tout à = 1,...,r, par 
üu; = i/r. En particulier, la fréquence asymptotique moyenne de séjour en à 
est u; = 1/r et le temps moyen de retour en à est M;;=r (1<i<r). 


Démonstration. D'après le Lemme 6.4.1, on a Pr ST, donc aussi {(P?) Sin 
et {TI est stochastique, donc IT est bistochastique. Comme la chaîne admet une 
seule classe récurrente, il résulte du Théorème 6.4.4 (2) que les coefficients ;,; 
de la matrice limite IT = (r;,;) ont la propriété suivante : pour tout (i,3) on 
a: Ti; = 7j. De plus, il existe une et une seule loi de probabilité stationnaire 
u= (w,...,w) donnée par u; = 7; (1<j<r). 

Il reste à évaluer les nombres TS: Comme H est bistochastique, pour tout 


j=l,..,r, mal=m= m5 = rm, d'où uj = 5 = 1/r. 


Comme 7; =1/r > û, il résulte encore du Théorème 6.4.4 que tous les états 
sont récurrents. Ii n’y a donc qu’une classe indécomposable, qui est récurrente 
et la chaîne est irréductible. [] 


Remarque. Si le nombre des états est fini, égal à r et si la matrice de tran- 
sition P est bistochastique, la loi de probabilité uniforme u = (1/r,...,1/r) 
est toujours une loi de probabilité stationnaire. En effet, pour tout A on à 


l/r = ZU/r) pis = (fr) È Pi, puisque P est bistochastique. C’est le fait 


que la haine admet une seule classe récurrente qui permet de vérifier que 
cette loi de probabilité stationnaire est unique. 

S’i y a au moins deux classes récurrentes, il n’y a plus unicité, comme le 
montre l’exemple suivant : E = {1,2}, P = è 9 . On voit que, pour tout a 


tel que 0 < à < 1, la loi de probabilité 4 = (æ,1 — a) est stationnaire. 


6.8 COMPLÉMENTS SUR LES MATRICES POSITIVES 


Soit A = (ai) (1 < à, < r) une matrice carrée,! d’ordre r > 1, à coefficients 
réels. Elle admet r valeurs propres, réelles ou non, distinctes ou confondues. 
Soit s (1 < s < r) le nombre de ses valeurs propres distinctes, notées 1, 

, Às. Pour chaque à = 1,...,s, on désigne par a; la multiplicité de À;, 
de sorte que a +---+as = r et que chaque À; est un zéro d'ordre @:; 
du polynôme caractéristique det{J — À A) de la matrice À. Nous ordonnons 
ces valeurs propres, chacune prise un nombre de fois égal à sa multiciplicité, 


comme suit : Ày,...,)1, ... , Àg,..., de. 
Rues ne — 
1 fois @s fois 


1 La théorie spectrale des matrices à coefficients réels positifs remonte à O. Perron (Über 
Matrizen, Math. Annalen, 64, 1907, p. 248-263) et à G. Frobenius (Über Matrizen aus 
positiven Elementen, Sitz. Ber. Akad. Wiss. Phys-math. Klasse, Berlin, 1908, p. 471-476, 
1909, p. 514-518, 1912, p. 466-477) et est souvent appelée Théorie de Perron-Frobenius, 
Nous ne donnons ici que les éléments indispensables pour l'étude des matrices stochastiques. 
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La théorie de la réduction d'une matrice à la forme de Jordan montre qu'il 
existe une matrice régulière S, d'ordre r, telle que 


D, 0 0 
e 0 D 0 
ST AS= |. : . 
0 0 ..…. D, 
où, ici, les O désignent des matrices nulles et où, pour chaque à = 1,...,5, 


la matrice D; est une matrice triangulaire supérieure, d'ordre a;, dont les 
coefficients diagonaux sont égaux à À;, de la forme 


EE | 
0 À # ... + 
D; = : Loi : 
Does 
0 0 0... x 


Une telle matrice D; peut encore s'écrire D; = À; la, +3, où L,, est la Imatrice- 
unité d'ordre @; et uw; est une matrice triangulaire supérieure stricte. Pour 
chaque à = 1,...,s, notons J; (resp. u;) la matrice, d'ordre r, déduite de 4’ 
en remplaçant tous les blocs diagonaux D; par 0, sauf le bloc D;, que l’on 
remplace par La, (resp. par wi). 

Dans ces conditions, la matrice 4’ peut se récrire 


A'= DA Ji +). (6.8.1) 
1 


Les matrices Ji, w; (1 < i < s) vérifient les relations : 
LJ;= Ju; = wJ;=uwu; =0 (i£j); {relations d'orthogonalité] 
JÈè =, Ju =; 
(x) = 0, dès que n > ai. fu est nilpotentel 
De plus, 
Ÿ J;= 1, (matrice unité d'ordre r). 
il 


De (6.8.1) et des relations d’orthogonalité, on déduit, pour tout nr > 1, 


s 
(AY = SA +u)". (6.8.2) 
ii 
: A ui à 
Si la valeur propre À; est non-nulle, on pose : Q{(n) := (a+ +) . À cause des 
î 
relations précédentes, Qi{n) = S (RP ARC 2 LES À ()Gui/A9*. Comme 
1 i=0 


(ui)t = 0 dès que k > ai, on voit que Q{(n) est un polynôme en n, à coefficients 
matriciels, de degré au plus égal à a; —-1<r. 
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Si une valeur propre est nulle, disons À = 0, alors (A1 Ji +u1)" = (1) est 
nul dès que n > a1. Par convention, on définit Q{{n) comme étant le polynôme 
nul (à coefficients matriciels). Avec cette convention, pour tout k > 1, tout 
{> Let tout couple (4,5) tel que 1 <i,j<s,ona: 


Qi(E) Q$ 0) = 6,5 Ok +1). (6.8.3) 
De plus, pourn>7r, 
(AY = SA)" Q{(n). (6.8.4) 
#1 


Pour tout À = 1,...,s, posons Q(n) :—= SQ{{n)S71 On à alors l'identité 
É 

At = (SAS 1) 2 5 (4 6-1 = Y (x) Q(n), qui est valable pour n > r. 
es 

On à ainsi démontré le théorème suivant. 


Théorème 6.8.1. Soit À une matrice carrée réelle d'ordre r, soient À1, .. , 
Às ses valeurs propres distinctes, de multiplicité o1, ... , as, respectivement, 
Alors, pour tout n > r, on a l'identité 


8 


(ay = SX)" Qi(n), (6.8.5) 


i=] 


où, pour chaque à = 1,...,s, la matrice Qi(n) est un polynôme en n, à 
coefficients matriciels, de degré au plus égal à ai — 1 < r et où pour tout 
k2>1, toutl > 1 et fout couple (à, j) tel que 1 < i,j < 8, on a la relation 


Qi) 50) = &5 Qi +0. 
ÂAppliquons le Théorème 6.8.1 lorsque À est une matrice stochastique P. 


Théorème 6.8.2. Soit P une matrice stochastique d'ordre r. Alors 

(a) toute valeur propre de P est de module au plus égal 1 ; 

(b) si À; est une valeur propre de module 1, alors le polynôme Qu(n), qui 
lui correspond dans (6.8.5), se réduit à une matrice constante Qi. 


Démonstration. Partons de la représentation 
s 
4} = YO)" Qui), 
k=1 


où À = P et multiplions-la à gauche par Q:(1); on obtient : Q;(n)(P)* = 
{A}*Qi(n+1). Introduisons alors la norme || AÏ] := sup, ©; lax4| d'une matrice 
À = (ay) et utilisons l'inégalité sur les normes, valable pour deux matrices À, 
B : JAB| < [AÏIBI. On obtient : JAf*{|Qi(n + 1] < QI IPA = 
HQ@:(DH = K < +00, puisque |[P*] = 1. 

Il en résulte que, pour tout #, on à : [| < 1. D'autre part, si [M] = 1, le 
degré du polynôme Q;(n) est forcément 0. {| 
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Utilisons maintenant le fait que toute matrice stochastique P admet la 
valeur propre À := 1 et désignons par II la matrice constante II := Q1 de la 
représentation (6.8.5). Nous obtenons le théorème suivant. 


Théorème 6.8.3. Soit P une matrice stochastique d'ordre r. Alors, pour tout 
n>r,ona: 


(Pr = 0+ 50) Q;+ Y or)" Qu(n), (6.8.6) 
j k 


où la première (resp. la seconde) sommation Y; (resp. X4) est étendue aux 
valeurs propres À;, de module 1, distinctes de 1 (resp. aux valeurs propres px, 
non-nulles, de module strictement inférieur à 1). En outre, I? = IT et @ = Q; 
pour tout j, te. TI et les Q; sont des projecteurs. 


Théorème 6.8.4. Soit P une matrice stochastique d'ordre r. Alors la suîte 
(P*) (n > 0) converge, au sens de Cesaro, vers une matrice TE, d'ordre r, qui 
est un projecteur (IL? = Il), soit 

P+PI+..+P" 


PRO ou IT, 
ñ 


lorsque n tend vers l'infini. 
Démonstration. Dans la relation (6.8.6), on a lim: (04)" = 0; de plus, Qu(n) est 
un polynôme en n; de là, lim,(p4)" Qu(n) = 0 et aussi nc (o)" Quin) = 0. 
Ensuite, chaque Q; est une matrice constante et l'inégalité 
ht 
pts <122 
nf; 
montre que nc (x5)*Q; = 0. D’après (8.6), on obtient bien la relation : 
imol(Pr = 
jme = 0 


n 


Remarque (Méthode pour déterminer la matrice Il). Soit P une matrice stochas- 
tique d'ordre r. Alors la matrice À := iG + P) est encore une matrice 
stochastique d'ordre r. En outre, si À est valeur propre de P admettant X 
comme vecteur propre, alors (1 + À)/2 est valeur propre de À admettant X 
comme vecteur propre. On peut donc réduire parallèlement les matrices P 
et À. En désignant par M = 1, As, ..., À, les valeurs propres distinctes de P, 
ona,poun2>r: 


Pr=T+ Dar Qi(n), 
i=2 


A2 +5 LA) un). 
i=2 


On sait que Pr SIL Par ailleurs, pour à = 2,...,s,ona || <1et À #1, 
d’où {(1+À;)/2| < 1. Par conséquent, 4° — IE, au sens ordinaire. Ainsi, pour 
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calculer la limite au sens de Cesaro de P”, on forme À := LI, + P) et on 
calcule la limite, au sens ordinaire, de A*. 


n 
Le résultat A" — IT s'exprime encore par : (1/2) Ÿ= (}) Pk II. 
#=0 


6.9 COMPLÉMENTS ET EXERCICES 
6.1 Le score du jeu du tennis! 

Deux joueurs À et B décident de faire un tjeu» de tennis. Le {jeu est une 
succession de (coups) joués entre les deux joueurs. Le score initial est (0,0). 
On attribue 15 points au premier coup gagné par l’un des joueurs, puis 30 
au second, 40 au troisième et 50 au quatrième, de sorte que le score passe de 
(0,0) à (15,0) ou à (0,15), puis à (30,0), ou à (15,15), ou encore à (0,30)... 
Le joueur qui gagne le jeu est Le joueur qui atteint 50 points à la réserve près 
que l’autre doit avoir au plus 39 points. 

Par conséquent, lorsque le score est de (40,30) (resp. (30,40)), deux 
possibilités se présentent : 

ou bien À (resp. B) gagne le coup suivant et le score passe à (50,30) (resp. 
passe à (30,50)) et À (resp. B) a gagné le jeu; 

ou bien B (resp. À) gagne le coup et on considére que l’on revient au score 
(30, 30) et les deux joueurs doivent continuer à jouer. 

On suppose que les coups sont joués indépendamment et que À a la 
probabilité p et B la probabilité g de gagner un coup (0 <p<1,p+q=1). 
Le processus du jeu est assimilé à une chaîne de Markov homogène, dont 
les états sont les scores possibles. Le graphe associé est représenté dans la 
Figure 6.1, les flèches horizontales dirigées vers la droite, ainsi que l'unique 
flèche verticale dirigée vers le bas, portent la probabilité p; les autres flèches 
portent la probabilité g. Le joueur À gagne le jeu lorsque le score atteint l’un 
des états (50,0), (50,15), (50,30); le joueur B gagne en (0,50), (15,50) ou 
(39,50). En convenant qu'il y a une probabilité égale à 1 de rester dans lun 
de ces six états, lorsqu'on l’a atteint, ces six états sont des états absorbants 
de la chaîne. (Dans le graphe, il faudrait mettre une boucle de poids 1 autour 
de chacun d'eux.) 

Les scores ap = (30,50), a1 = (30,40), az — (30,30), az = (40,30), 
aa (50,30) forment un ensemble clos; le déroulement de la chaîne à 
l'intérieur de cet ensemble est identique à une chaîne de Markov qui est celle 
du modèle de la ruine du joueur. 

(a) On sait donc calculer la probabilité d'atteindre 44 en partant d’un des 
états a1, a2, as (cf. 86.3). Donner le résultat. 

{b) Trouver la probabilité que À gagne en arrivant au score (50,0) {jeu 
blanc), au score (50,15). 


1 Cet exercice a été proposé dans J.G. Kemeny & JL. Snell (Finite Markov Chains. 
Princeton, D. Van Nostrand, 1960, 57.2.) La solution donnée ici reprend celle qui nous 
avait été fournie par P. Cartier. 
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(0,50) (15,50) (30,50) 
(0,40), (15,40). +.(80,40) 
(0,30), (15,30). (30,30) (40,30), (50,30) 
(0,15), (15,15), (30,15), (40,15), (50,15) 


(0,0) —+ (15,0) —+ (30,0) —+ (40,0) —+ (50,0) 


FIGURE 6.1 


{c) Pour à = 1,2,8, soit T; le temps d'atteinte de la chaîne dans l’état a. 
Déterminer les trois probabilités p; := P(OO{T < min{T; : j # i}} 
i=1,2,3). 
( (a) La D sbabilité pour À de gagner le jeu vaut : 

15p4 — 34p5 + 28p6 — Sp? 
: 1=-2p+2% ° 
Vérifier que F'{p) + F{1 — p} = 1 et en donner l’interprétation. 


F(p) 


6.2 On considère une chaîne de Markov homogène, admettant (r +1) états, 
numérotés de 9 à r (r > 2). On suppose que si le processus est dans l’état 0, il 
a la probabilité i d’y rester en une épreuve et la probabilité 1/(2r) de passer 
dans l’un quelconque des états 1, 2, ... , r. Il a, d'autre part, la probabilité 
nulle de passer à l’état O0 à partir de l’un quelconque des états 1, 2, ... ,7. 
Enfin, s'il est dans l’état à (1 < à < r — 1) (resp. r), il a, en une épreuve, la 
possibilité d'y rester avec la probabilité à, ou la possibilité d’aller dans (i+1) 
{resp. 1) avec la probabilité Le 

(a) Donner la matrice de passage P pour r = 2,3 et les différentes classes, 
ainsi que leur périodicité. 

(b) Pour r =2 et n > 1, déterminer P"; trouver lim, P°. 

(c) Déterminer si? = P{T = n|X6 = 1} (la probabilité que la chaîne 
retourne, pour la première fois, en 1, à la nième transition). Évaluer l'espérance 
mathématique et la variance de T1, par rapport à la mesure de probabilité 
P{|X06 =1}. 

(4) Pour r > 2 arbitraire, trouver lim, P°. 


6.3 Mouvement cyclique 

Une particule parcourt les sommets d’un polygone régulier à r côtés. Ces 
sommets sont numérotés l,...,r, disons, dans le sens trigonométrique et 
constituent les r états du processus considéré ci-après. Si, à un instant 
déterminé, la particule est dans l’état à (2 < à < r) (resp. dans l’état 1}, alors, 
à l'instant suivant, elle sera dans l'état (à + 1) (resp. 2) avec la probabilité p 
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et dans l'état (4 — 1} (resp. dans l’état r) avec la probabilité g. On suppose 
O<p<let p+gq= 1. En notant X, (n > 0) l’état occupé par la particule 
à l'instant n, on définit ainsi une chaîne de Markov homogène, de matrice de 
transition 


128. r-2r-1r 
1 f0p 0. 0 © a 
2 fa 0» û © 6 
3 |0 4 0 0 0 0 
r-2|0 0 0 0 p 0 
r-1[0 00 g 0 p 
r \P00. 0 4 0 


Faire l’analyse de cette chaîne de Markov. 


6.4 Séjour dans un labyrinthe 

Un rat se déplace dans un labyrinthe, représenté dans la Figure 6.2, qui 
comporte neuf compartiments, numérotés de 1 à 9. À chaque unité de temps, 
il change de compartiment. Lorsqu'il est dans un compartiment ayant k 
portes (2 < & < 4), il choisit l’une de ces £ portes avec probabilité 1/4. 
Le cherninement du rat est assimilé à une chaîne de Markov homogène dont 
l’ensemble des états est formé des neuf compartiments. 


1 2 3 

E 5 4 

7 8 9 
FIGURE 6.2 


(a} Écrire la matrice de transition P. 

(b) La chaîne est-elle irréductible, périodique, ergodique ? 

(c) Montrer que la loi de probabilité u = (u1,...,w9), où chaque uw; est 
proportionnel au nombre de portes que comporte le compartiment é, est une 
loi de probabilité stationnaire pour la chaîne de Markov. Interprétation. 


6.5 Les coccinelles 

On considère un hexagone régulier dont les sommets sont numérotés 1,...,6, 
dans le sens trigonométrique. À la date 0, deux coccinelles sont placées aux 
sommets i et j, respectivement. À la date 1, chacune des coccinelles se déplace, 
indépendamment de l’autre, vers l’un des deux sommets adjacents, avec une 
probabilité k À la date 2, l'opération se répète et ainsi de suite. On demande le 


112 6 & Applications des chaînes de Markov 


temps moyen que mettront ces coccinelles pour se rencontrer pour la première 
Jois. Si i — j, ce temps est celui de leurs premières retrouvailles. 


6.6 Soient (Xh) (n > 0) une chaîne de Markov, homogène, à un nombre fini 
d'états et P = (p;,;) sa matrice de transition. 

(a) On définit le processus (Y,) (n > 1), où Yu := (Xn_1, Xn). Ce processus 
est-il de Markov ? Si oui, déterminer sa matrice de transition. 

{b) On suppose que le processus (XA) (n > 0) est ergodique et on désigne 
par u := (up,w1,...,u.) sa loi de probabilité stationnaire (unique). Calculer 
Emmy PÉe = (6,7)}. 


6.7 On reprend les mêmes notations que dans le paragraphe 2 pour le 
problème de la ruine du joueur. Il y a trois classes indécomposables : {0}, {a} 
(classes récurrentes, puisque 0 et a sont absorbants), {1,...,(a — 1}} (classe 
transiente, périodique de période 2). Il existe une infinité de lois de probabilité 
stationnaires, portées par Les deux états absorbants 0 et a. 


6.8 Collectionneur de vignettes, autre calcul 

Pierre achète des tablettes de chocolat d’une certaine marque. Dans chaque 
tablette, il trouve une vignette qu’il peut coller dans un album édité par cette 
marque. L'album contient 5 emplacements. Soit T le nombre de tablettes 
qu'il lui faut acheter pour terminer son album, en supposant que chaque fois 
la probabilité d’avoir une vignette donnée est 1/m#. Comme démontré dans 
l'Exercice 2.6, on a E[T] = mHw, où Hm = 1+ +... +1. Construire 
une chaîne de Markov, permettant, en faisant usage du Théorème 6.2.8, de 
retrouver cette évaluation. 


6.9 Soit Rec (resp. Tra) l’ensemble des états récurrents (resp. transients) 
d’une chaîne de Markov finie et homogène et soit T le temps d'atteinte dans 
l'ensemble Rec. 
(a) Pour tout état , ona: EfT]=1+ D pi; EÆ[7]. 
36 Ta 


(b} On considère le modèle de la ruine du joueur {ef. 8 5.2.4) pour a = d et 
on désigne par T le temps d’atteinte dans l’un des états de ruine Ü ou a = 4. 
Évaluer E‘{T] pour i = 1,2,3. 

{c) Dans le problème du jeu de tennis (ef. Exercice 6.1), en utilisant les 
mêmes hypothèses et notations, déterininer la durée moyenne de la fin du jeu 
à partir du moment où le tableau d’affichage montre le score (40, 15). 

(d) On peut aussi calculer la fonction génératrice de cette durée moyenne, 
par une analyse directe du graphe de ia chaîne. 
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6.10 Soit P: = (pis) (1 < é,j < r) une matrice stochastique d'ordre r. On 
pose w := rain Pis. une quantité comprise entre 0 et 1. Si À est une valeur 


propre de P, lors [À —w| < 1—w, c'est-à-dire toute valeur propre de P est 
située dans le disque de centre (w,0) et de rayon (1 —w). 


Chapitre 7 


Martingales 


L'étude des martingales qui est proposée ci-dessous repose très fortement sur 
l'algèbre des espérances conditionnelles, dont la forme utile a été rappelée 
dans le paragraphe 1.13. Les Règles numérotées de 1 à 6, qui y ont été 
données, sont utilisées constamment. Comme rappelé dans le paragraphe 1.13, 
les formules qui comportent des espérances conditionnelles ne sont vraies que 
presque sûrement, 


7.1 PREMIÈRES PROPRIÉTÉS 


On suppose donné un processus stochastique à temps discret, c'est-à-dire 
une suite (XA) (nr > 0) de variables aléatoires définies sur le même espace 
probabilisé. 


Définition 7.1.1. On dit que ce processus est une martingale si, pour tout nr > 0, 
les propriétés suivantes sont satisfaites : 

(a) E[IXal] < +; 

) Elns | Xo, X1,..., Xa] = Xa. 

Le second axiome fait apparaître l'espérance conditionnelle d’une variable 
aléatoire en un vecteur aléatoire. Cette définition sous-entend donc que pour 
tout r > 0 on sait déterminer la loi de probabilité du vecteur (Xo, X1,..., Xn). 

Originellement, la notion de martingale a été introduite pour décrire les 
caractéristiques d’un jeu équitable. Pour chaque n, on note X, la fortune d’un 
joueur à la nième partie d'un jeu donné. Le second axiome dit que, condi- 
tionnellement à la connaissance qu'a le joueur de l’évolution de sa fortune 
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jusqu'à l'instant n (y compris la n°" partie), l'espérance mathématique de 


sa fortune à la (n + 1)" partie est égale à sa fortune à la n'°"® partie. 

Cette définition est un peu restrictive. On préfère se donner deux suites 
{Xa) et (V3) (r > 0) de variables aléatoires définies sur un même espace 
probabilisé et prendre la définition suivante, 


Définition 7.1.2. On dit que le processus (X,) (n > 0) est une martingale par 
rapport au processus (Y.) (n > 0), si, pour tout n > 0, les propriétés suivantes 
sont satisfaites : 

(a) E[IXal] < +00; 

@) ElXnu | Vo Vi, , Ya] = Xn. 


Dans l'interprétation d’une suite de parties considérée plus haut, on peut in- 
terpréter (Yo, Y1,...,Y2) comme l'information recueillie par le joueur jusqu'à 
la ne partie (cette partie incluse). Or cette information peut comporter des 
données autres que la suite des fortunes X0, X1,..., Xn, Comme, par exemple, 
les résultats des parties où le joueur n’a pas joué. 

D’après la Proposition 1.13.1, on voit que l’on peut remplacer l’axiome (b) 
de la Définition 7.1.2 par : 

{b') pour tout entier n > 0 et tout évènement À appartenant à la tribu 
TF0, V1,...,Yhn) engendrée par le vecteur (Y, Y1,..., Ya}, on a la relation : 


EULAX à] = E(aX nl]. 
C’est, en effet, traditionnellement sous cette forme que l’axiome (b) est énoncé. 


Propriété 7.1.1. Si (X,} est une martingale par rapport à (YA), alors X, est 
une fonction mesurable de (Yo,...,Yn). (On dit que la suite (X}) est adaptée 
à la suite (Yn}.} 

Démonstration. Cette propriété découle immédiatement de la définition de 
l'espérance conditionnelle. Se reportant au diagramme de définition, on a bien 
ElXn1 | Vo, , Val = e(Yo,.…., Ya), où e est une fonction mesurable de R"+1 
dansR. [ 


Propriété 7.1.2. Si (X,) est une martingale par rapport à (YA), alors, pour 
tout n > 0, on a : E[X:] = Ef[Xo]. (Une martingale est à espérance 
mathématique constante.) 

Démonstration. De l’axiome (b) de la définition d’une martingale on déduit : 
EfXa] = E[E[X +11 Yo, Y1,..., Yal]. Or d’après la Règle 5, en prenant pour 
g l’application identique, on à E[E[X»41 | Yo, Y1,..., Ya]] = E[Xn41]. D'où 
ElXa41] = ElXx] et donc E[X,] = EfXo] par récurrence. [] 


Propriété 7.1.3. 5i (XA) est une martingale par rapport à (YA), alors, pour 
tout n > 0, on a : E[Xn|Yo,..., Ya] = Xu. 


Démonstration. D'après la Propriété 7.1.1, on à X» = e(Yo,...,Yh). On 
applique alors la Règle 2 avech=e. [| 
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Propriété 7.1.4. 5: (X,) est une martingale par rapport à (Y:), alors, pour 
tout n > 0 et tout k > 0 on a : E[X»4r | Vos... Ya] = Xn. 

Démonstration. La propriété est déjà vraie pour & = 0,1. Procédons par 
récurrence par rapport à k > 1. Dans l'identité de la Règle 6, prenons 
pour g l'application identique, puis faisons les substitutions X + X,:441, 
Zn... Ya) et Y + (Faux... ; Yaye). On obtient : 


EX | (Pose, Yn)] = EEK a+ | Vo... Yapa]| Vos. Ya] 
= ElXnar| Vo Vi = Xa 


d’abord puisque (X,) est une martingale par rapport à (Y,), ensuite en 
appliquant l’hypothèse de récurrence. [|] 


Donnons également une autre définition d’une martingale. 


Définition 7.1.3. Soient (X,) et (Yh) (n > 0) deux processus définis sur un 
même espace probabilisé. Le processus (X,) est une martingale par rapport 
au processus (Ÿ,), si pour tout n > 0, les propriétés suivantes sont satisfaites : 

(1) E[[Xxl] < +oo; 

(2) Xa est une fonction mesurable de Yo,..., Ya; 

(8) Ef(Kn41 — Xn) | Vos... , Yo] = 0. 


Les Définitions 7.1.2 et 7.1.3 sont bien équivalentes, car la Définition 7.1.2 
implique la Définition 7.1.3, en vertu des Propriétés 7.1.1 et 7.1.3. D'autre 
part, la Définition 7.1.3 implique la Définition 7.1.2, en vertu de la Règle 2. 
Notons qu’à cause de la Propriété 7.1.4, on peut remplacer la condition (3) 
dans la Définition 7.1.3 par 

{3°} pour tout »,k > 0, on à : E[(Xn4x — Xn) | Yo... , Yn] = 0. 


Les suites de sommes partielles de variables aléatoires indépendantes et 
centrées constituent les exemples les plus courants de martingales, comme 
décrit ci-après. 


Proposition 7.1.5. Soient Yo — 0 la variable aléatoire identiquement nulle et 
(a) (n > 1) une suite de variables aléatoires mutuellement indépendantes, 
centrées et telles que pour tout n > 0 on ait E{{YA|] < +oo. Pour tout n > 0, 
on pose Xn := Yo+Yi1+-:-+Yn. Alors la suite (XA) (n > 0) est une martingale 
par rapport à (YA} (n > 0). 

Démonstration. Tout d’abord, E[|Xa|] < E{[Yo|}+E[[Yi|]+:-:+E{}r|], une 
somme qui est finie. Ensuite, 


ElXa4 | Vo... , Ya] = ElXn Vos... , Ye] + Eloi Vo,..., Xal. 
En prenant A(yo....;Yn) = %o + -:: + %n dans la Règle 2, on obtient : 
ElXn | Yo... Yal = Yo+---+Yn = X}. D'autre part, comme les variables Y,41 
et (Y6,...,Yn) sont indépendantes, la Règle 1 donne : EfYn41|%0,..., Ya) = 
EfYn) = 0. D'où E[XaulYo,...,Ml=X» 0 
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7.2 LA MARTINGALE DE DCOB 


On part d’une variable aléatoire X de référence, du premier ordre, c’est-à-dire 
telle que E{[X}] < +00. On se donne, par ailleurs, une suite (Y,) (r > 0) 
de variables aléatoires, définies sur le même espace probabilisé que X. On se 
propose d'étudier le processus (X,) (n > 0} avec X, := EX |Y6,..., Ya]. 


Proposition 7.2.1. La suite (XA) (n > 0) est une martingale par rapport à 
la suite (YA) (n > 0). On l'appelle martingale de Doob. Cette martingale peut 
être considérée comme modèle de phénomènes d'apprentissage. 
Démonstration. D'abord, 

E[lXal] = ETELX 1%,...,Y]1] < EfE[/X]]Yo,...,Ya]] = E[IX{] < +oo, 


d’après la Règle 5. 
Ensuite, 
EfXns | Vos... Ya] = EIELX Yo... , Ya, Yapil| Vos... Yal 
= EfX|Y%,...,Y] fd’après la Règle 6] 
= Xn 


Dans le cas particulier où X = 14, on à X, = P(A|Y0,...,Y2). La suite 
(Xn) (n > 0) est donc une martingale de Doob. 


Nous nous proposons de voir comment toute martingale peut s'exprimer 
comme une martingale de Doob. Dans ce but, nous supposons donné une 
variable aléatoire Z uniformément répartie sur l’intervalle [0,1]. Pour chaque 
entier n > 0 on définit ensuite la variable Y} comme étant la ni?" approxi- 
mation de Z dans le développement binaire de Z. En d’autres termes, pour 
k=0,1,...,2%— 1, on pose : 


{Ya =k/27} siet seulement si {k/2° < Z <(k+1)/27}. 


Enfin, si f est une fonction bornée sur [0,1], on forme le quotient des 


différences : ( jf 
fo (Va+1/27) — fo Ya 
Xi ES . (72.1) 


Proposition 7.2.2. La suite (XA) (n > O0) est une martingale par rapport à 
(a) (m2 0). 

Démonstration. D'abord, on a E[{X,|] < +00, puisque f est bornée. Ensuite, 
par définition des Y}, conditionnellement à (Yo,..., YA), la variable aléatoire Z 
prend ses valeurs dans [Ÿ,, Y, +1/27{. Par ailleurs, pour tout sous-ensemble J 
de (Ya, Ya +1/2%[ on a 


P{ZEJIZE [Va Ye +1/2{}= ren 


=IMP{ZEJ}= PJ), 
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où £{J) désigne la longueur de J. Ceci montre que, conditionnellement à 


(M,...,Yh), la variable aléatoire Z est uniformément répartie sur [Yn, Ya + 
1/27]. 
D'autre part, conditionnellement à {Yo,..., Ya}, la variable aléatoire Y,41 


prend l’une des deux valeurs Ya, Ya +1/2"#1. Elle prend la valeur Y,, avec la 
probabilité 27/2741 = 1/9, si 7 € [a,Y, + 1/24] et la valeur Y,, + 1/27 
avec la probabilité 27/241 = 1/2, si Z € [V, + 1/24, Y, + 1/2"[. Ainsi, 
conditionnellement à (Yo, Y1,...,Y2), la variable aléatoire Y,41 prend l’une 
ou l’autre des valeurs Yn, Ya + 1/ 2°#1 avec la probabilité L 

H en résulte 


EX (Vo Val = 2HEff 0 (on + gr) — F0 Yo. Vl 


ni) 


cr (ro(r+ pa) 1er) 
+o(n+h) fort n)] 


=2"(fo (+ Dre) ü 


L'expression de X», donnée en (7.2.1), peut être interprétée comme une 
dérivée discrète de f en Z. Avec des hypothèses de régularité convenables, 
nous nous proposons de démontrer maintenant que la suite (X2) de ces 
dérivées discrètes converge presque sûrement vers une limite, notée X,, 
appelée dérivée de Radon-Nikodym de f en Z. 


Proposition 7.2.3. Supposons que f soit continue au sens de Lipschitz, à 
savoir qu'il existe une constante C' telle que, pour tout x et tout y pris dans 
l'intervalle {0,1}, on ait | f(x) — f{y)| < Clx — vi. Alors la suite (Xn) n > 0) 
converge presque sûrement vers une variable aléatoire limite X, appelée la 
dérivée de Radon-Nikodym de f en Z. 


Démonstration. D'abord, la suite (X,) (n > 0) est une martingale par rapport 
à (V3) (n > 0) d’après la Proposition 7.2.2. Pour établir la proposition, on. 
utilise le théorème de convergence pour les martingales (qu’on établit dans 
les paragraphes suivants) qui dit que si (X,) est une martingale satisfaisant 
supEliX;]] < +0», alors (X,) converge presque sûrement vers une variable 
n>0 


aléatoire Xoo intégrable. L'inégalité précédente est évidemment satisfaite, 
puisque, d’après la ortion de Lipschitz, on a, pour tout n > 0, 


le if © (Fa +1/29) — fo Ya] < C < +00, 


TE 
et donc supE{[|X2]] < +co. 
n>20 


La variable X. permet d'exprimer la martingale (X,) comme une martin- 
gale de Doob, comme montré dans la proposition suivante. 
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Proposition 7.2.4. On conserve la définition de Xh donnée en (7.2.1) et les 
hypothèses de la Proposition 7.2.3. Soit, de plus, X. la dérivée de Radon- 
Nikodym de f en Z. Alors, pour tout n > 0, on a : 
(72.2) Xn = E[Xco | Vo... Yale 


Démonstration, On à vu, en vertu de la condition de Lipschitz, que pour tout 
n>0ona:|Xal < © < +00. Il en résulte, et nous l’admettrons, que la suite 
(Xa) est une martingale de Doob. Comme on a, par ailleurs, X; PE, x, cette 
martingale (X,) admet la représentation (7.2.2). [| 


7.3 LA MARTINGALE DE WALD 


Cette martingale intervient dans de nombreuses applications et mérite un 
traitement spécial. 


Proposition 7.3.1. Soient Yo := 0 et (Ya) (n > 1) une suite de variables 
aléatoires, indépendantes, identiquement distribuées, admettant une fonction 
génératrice g(u) = Ele"“Ÿ] pour au moins un réel u 7 0. Posons Xo := 1 et 
pour n > 1 posons XA := g(u) "e"i+-#%). Alors (Xn) (n > 0) est une 
martingale par rapport à (Y,) (n > 0), appelée martingale de Wald. 
Démonsiration. D'abord, pour tout # > 1, on a : E[|XA[] = E[X:] = 1 < +00. 
Notons qu'on a ensuite Xny1 = X, ent /g{u), d'où 


Br Vo Va] = En Po 
( nu | Os. Al = [ | LEE) A 
etat 
= AE... Ya] en vertu de la Règle 4] 
g(u) 
etat 
= XE| LS) ]=%. [ 


[en vertu de l'indépendance des Y;] 


Exemple. Prenons £L{Y) = N(0,a), d'où glu) = Ee“*] = e“*°°/2, On voit que 
g(u) est définie pour tout u € R. Il en résulte que X, = e"Mi++Yn)-nu0?/2 
est une martingale pour tout u € R. 


7.4 SURMARTINGALES ET SOUS-MARTINGALES 
Rappelons que pour tout nombre réel x, on pose 
gti=sup(x,0) et x7:=—inf(x,0). 
Définition 7.4.1. Soient (X3), (Ya) (n > 0) deux processus définis sur un même 


espace probabilisé. On dit que (X,) est une surmartingale par rapport à (Y:), 
si pour tout n > 0, 
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(a) E[X;] < +00; 

(b) ElXn+1 | Yo, Vi,..., Ya] < Xa; 

(c) XA est une fonction mesurable de Y5, ... , Ya. 
On dit que (X}) est une sous-martingale par rapport à (Y2), si pour tout 
nm 20, 

(a) EFXT < +00; 

b) ElXn1Ye,%,..., Ye] 2 Xus 

(c) X, est une fonction mesurable de Y5, ... , Ya. 


Remarque 1. On note ici que la condition (c) était implicite dans la Défin- 
ition 7.1.1 des martingales et résultait de l’axiome (b), ce qui n'est pas le cas 
pour les surmartingales et les sous-martingales. 


Remarque 2. Il est évident que (X,) est une surmartingale si et seulement 
si (—X}) est une sous-martingale par rapport à (Y2). Par ailleurs, (X,) est 
une martingale si et seulement si (X,) est à la fois une sur-martingale et une 
sous-martingale par rapport à (Y:). 


Donnons des méthodes de construction de sous-martingales à partir d’une 
martingale ou d'autres sous-martingales. 


Lemme 7.4.1. Supposons données : 

(a) une martingale (Xh) par rapport à (Y3); 

(b} une fonction convexe 4 telle que, pour tout n > 0, l'espérance 
mathématique E[(ç o X,)*] est finie. 
Alors (po Xh) est une sous-martingale par rapport à (Yh). 


Démonstration. On rappelle l'inégalité de Jensen qui stipule que si y est une 
fonction convexe et si X est une variable aléatoire d'espérance mathématique 
finie, on a : @(E[X |Y]) < Elo X | Y} (voir Exercice 7.8). 

Il s’agit de vérifier laxiome (b) des sous-martingales. D’après l'inégalité 
de Jensen, on à El o Xn41 | Yo,..., Ya] > @(EIX 41 | Yo... nl) = P(Xn), 
puisque (X,) est une martingale par rapport à (Y;). {] 


Corollaire. Soit (XA,) une martingale par rapport à (YA). Alors 

(a) (LXnl) est une sous-martingale par rapport à (Y:); 

(b} si pour tout n > 0 on a EÏX?} < +oo, alors (X2) est une sous- 
martingale par rapport à (YA). 
Démonstration. Pour (a), on prend la fonction convexe # + |x| et pour (b) la 
fonction x + x?. Dans ce dernier cas, l'existence du second moment des X, 
est indispensable pour que l’axiome (a) des sous-martingales soit satisfait. [] 


Lemme 7.4.2. Soient (X,) une sous-martingale par rapport à (YA) et une 
fonction convexe et croissante telle que pour tout n > 0 on ait E[|y o XA[] < 
+co. Alors (po X,) est une sous-martingale par rapport à (YA). 
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Démonstration, Il s’agit de vérifier l’axiome (b) de la définition des sous- 
martingales. Or, en appliquant l'inégalité de Jensen, puis en utilisant le fait 
que (Xh) est une sous-martingale et que $ est croissante, on obtient : 


Elg o Xar11Y0,..., Ya] > P(ELXn41| Yo... Ya) > poXn [Ù 


Corollaire. Si (X,) (n > 0) est une sous-martingale, il en est de même de 
(&ÿ) (m2 0). 

Démonstration. Plus généralement, prenons (x) := x ou € suivant que l’on 
aæ > c ou non. Alors w est croissante et convexe. De plus, E[}y o X;|] < 
Ef{[Xnl] < +oo. Le Lemme 7.4.2 s’applique et (0 XA} est une sous-martingale 
par rapport à (YA). L'énoncé du Corollaire correspond au cas particulier 
c=0. 


Nous donnons, maintenant, pour les sous-martingales et les surmartingales, 
les propriétés analogues à celles énoncées dans les Propriétés 7.1.2-7.1.4 pour 
les martingales. 


Propriété 7.4.3. Soit (Xn) (n > 0) une martingale (resp. une sous-mar- 
tingale, resp. une surmartingale) par rapport à (Y:) (nr > O0). Alors la 
suite numérique de terme général EÎX,] est constante (resp. croissante, resp. 
décroissante). 

Démonstration. Si (X,) est une martingale (resp. une sous-martingale, resp. 
une surmartingale), on à : É[Xa41—Xn | Yo,..., Ya] = 0 (resp. > 0, resp. < 0). 
En prenant l'espérance mathématique, on obtient, d’après (1.2), les relations 
EfXn1 — Xn] = 0 (resp. > 0, resp. < 0), ou encore E[X241] = E[X,] = E[X0] 
(resp. ELA] < EUXuul, resp. EUX] > ELXoul). 0 


Propriété 7.4.4. Soit (XA) (n > 0) une martingale (resp. une sous-martin- 
gale, resp. une surmartingale) par rapport à (Ÿ,) (n > 0). Alors, pour tout 
k > 0 on a : E[Xnx (Yo, , Yn)i = Xn (resp. > Xn, resp. < Xn). 
Démonstration. On procède par récurrence sur #, la propriété étant déjà 
vraie pour # = 0,1. En appliquant la Règle 6, prenons go X := Xpipyi 
Ze (Vo... Ma), Ÿ = (Vaio... Ya+k). Alors 

ELE(X are | (Vos... Yask)]| (Pos... ,Ya)] = ElXn4rpi | (Pose. Yn)l. 
Or, si (X,) est une martingale (resp. une sous-martingale, resp. une surmartin- 
gale}, on a : E[Xusx41 Yo... Ynse] = Xnyx (resp. > Xn4e, resp. < Xn3x). 
D'où E[Xn+#41 | (Vo... , Yn)] = ElXnge | (Vo... Yn)] (resp. 
EfXn+44 | (Mo. -Ya)} 2 ElXn+4 | (Do... » Ya)l, resp. 
EiXnsret | (Vos. Yn)] € ElXn+e| (Vo, Yn)l). D'où, enfin, 
EX lo Val = Xn (resp. > An resp. € Xn), par l'hypothèse de 
récurrence. 


Proposition 7.4.5. Soit (Xh) (n > 0) une martingale (resp. une sous- 
martingale, resp. une surmartingale) par rapport à (Y,) (n > 0). Soit An 
un évènement de la tribu engendrée par (Yo... , Ya). (On peut encore dire un 
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évènement dont l’indicatrice Ta, est une fonction mesurable de (Y5,...,Yn).) 
Alors, pour tout k > 0 on a : É[14, Xnax] = E[L4, Xn] (resp. E[L4, Xau] > 
EU4,Xn}, resp. Ella, Xn+x] < ElL4, Xn]). 
Démonstration. D’après la Proposition 7.4.4, on a : 
El4, Xn+t] = ElE( 4, Xn4x | Vo, Ya]] = Ella, ElXn4k | Yo... al] 
= Ella, Xnl (resp. > E[Z4, Xn], resp. < EZ4, Xn]). [ 


7.5 COMPLÉMENTS ET EXERCICES 


7.1 Soit Y5 la variable identiquement nulle et (YA) (n > 1) une suite de 
variables aléatoires, mutuellement indépendantes, identiquement distribuées, 
centrées et ayant chacune le moment du second ordre o?. Pour chaque n > 0 
on pose : 


ae (Dr) -m (Dr) le (Dr) net 


Alors (Xh} (n > 0) est une martingale par rapport à (Y.) (n > 0). 


7.2 Martingale associée à une chaîne de Markov 

Soit (Y1} (n > 0) une chaîne de Markov, dont l’ensemble des états est 
E = N* = N\{0} et la matrice de transition est notée P = {pi;) (i,j > 0). 
Soit f une application de N* dans R+, telle que pour tout n > 0 on aît 
E{jf o Y.]] < oo, non identiquement nulle, vérifiant l'identité Pf = f. 
Autrement dit, f est un vecteur propre à droite de P, associée à la valeur 
propre 1, ou encore satisfait le système d'équations : X ps; f(j) = f(i) (à > 0). 


7 
Pour chaque n > 0, on pose : XA := f o Yn. Alors (X,) (n > 0) est une 
martingale par rapport à (Y,) (n > 0). 


7.3 On reprend les mêmes hypothèses que dans l'énoncé du précédent exer- 
cice, avec la seule différence que l’on suppose que f vérifie l'identité Pf = À f 
pour un certain nombre À # 0; de plus, pour chaque n > 0 on pose cette fois : 
Xa = À fo Ya. Alors (Xh) (n > 0} est une martingale par rapport à (Y;) 
(r > 0). 


7.4 La martingale de Wald ; cas particulier 

Soit Ÿ une variable aléatoire prenant ses valeurs dans Z. Pour tout k € Z, on 
pose gx := P{Y = k}. On suppose que la fonction génératrice des moments 
g(u) = Efe“*] existe pour au moins une valeur 4 %# 0. Soient Yo := 0 et 
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(Fa) (r > 1) une suite de variables aléatoires, indépendantes, identiquement 
distribuées, ayant chacune même loi de probabilité que Y. 

(a) On pose So := 0 et Sh :2== Yi +... + YA pour nr > 1. Alors ($,) (nr > 0) 
est une chaîne de Markov, d'ensemble des états Z et de matrice de transition 
P = (g-5 (àj €). 

(b) On a Pf = g{u) f pour la fonction f : j + ei. 

(c) Enfin, on pose Xo := 1 et pour n > 1, on définit 


Xn:= g{u) * exp(u(Yi +. +Y2)). 
Alors (XA) (n > 0} est une martingale par rapport à (Y,) (n > 0). 


7.5 Rapports de vraisemblance 

Soient (Y;) (n > 0) une suite de variables aléatoires, indépendantes, identique- 
ment distribuées, admettant chacune la densité de probabilité fo, ne prenant 
pas la valeur nulle. Soit f1 une seconde densité de probabilité. On considère 
la suite des rapports de vraisemblance (X,} (n > 0), où, pour chaque n > 0, 


on pose : 
fioW:fhoY:.-fioY 

foo Y:foo Vi foo Mn 

Si les variables aléatoires Y; admettent toutes fg > 0 comme densité de 

probabilité, alors (XA) (n > 0) est une martingale par rapport à (Y,) {n > 0). 


Xn := 


7.6 Soient Y5 = ce et (Yh) (n > 1) une suite de variables aléatoires, 
indépendantes, telles que pour tout n > 1 on ait : E[[YA|} < oo et E[Y,] = 1. 
On pose Xo := cet Xn := cV--- Ya (n > 1). Alors (X,) (n > 0) est une 
martingale par rapport à (Ya) (n > 0). 


7.1 La martingale de Wald: autre démonstration 

On prend les mêmes hypothèses que dans l'Exercice 7.4. En utilisant les 
techniques de l’Exercice 7.6, on démontre directement que (XA) (n > 0) est 
une martingale par rapport à (YA) (n > 0). 


7.8 L'inégalité de Jensen 
Soient une fonction convexe de R dans R et X une variable aléatoire telle 
que X et $o X aient des espérances mathématiques finies. Alors ÿ(E[X]} < 
El o X]. L’inégalité est aussi vraie pour les espérances conditionnelles : 
pŒ[X | Y)) < Evo X|YF]. 

[Utiliser le fait que le graphe de 4 est au-dessus de toute droite d'appui, 
autrement dit, pour tout € il existe un nombre À = À(£) tel que la droite 
d'appui passant par {£,w(£}} et d’équation y—(£) = À(x—£)} soit au-dessous 
du graphe de y, soit w{x) 2 A(x — €) + (é)i 
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7.9 Soit (Y:) (n > 1) une suite de variables aléatoires indépendantes et 

identiquement distribuées et telles que pour tout # > 1 on ait E[[Y;|] < +oo. 

On note y la valeur commune de l'espérance mathématique et pour r > 1 on 
n 

pose Xn := ÿ Y4. Alors la suite (Xx) (r > 1) est une sous-martingale, une 
k=1 

surmartingale, une martingale par rapport à (YA) (n > 1), suivant que x est 

20,<0,—0. 


7.10 Soit (Yh) (n > 1) une suite de variables aléatoires indépendantes, 
centrées, admettant chacune un moment du second ordre. On pose S, := 
R 

S Yuet Xn := (8,)?. Alors la suite (X:) (n > 1) est une sous-martingale 
k=1 

par rapport à (Yan). 


7.11 Soit (X2) (n > 1} une suite de variables aléatoires, indépendantes, 
na 

identiquement distribuées, du premier ordre. On pose $, := D Xx, Yn = 
=1 


Shfn {n > 1). Alors la suite ...,Yn,Ÿn-1,...,Ÿ1 est une martingale par 
rapport à elle-même. 


Chapitre 8 


Théorèmes d'arrêt 


On se propose, dans ce chapitre, de savoir comment lorsqu'on remplace le 
temps linéaire, matérialisé par l'indice n, dans une martingale (X,), par un 
temps d'arrêt T adapté aux X4, la variable aléatoire transformée (Xr) a 
encore comme espérance mathématique la valeur commune des espérances 
des Xn. Le résultat le plus simple à établir et qui pourtant est à la base de 
tous les résultats ultérieurs est obtenu lorsque le temps d'arrêt T est borné 
{cf. Théorème 8.2.1). Il constitue le premier énoncé du théorème d'arrêt. Nous 
donnons encore trois autres variantes de ce théorème. 


8.1 PROCESSUS ARRÊTÉ À UN INSTANT 


Considérons un processus stochastique (Y,) (n > 0) défini sur un espace 
probabilisé (Q,4,P). Rappelons que lon note 4, la tribu engendrée par 
le vecteur (Y5,Y1,...,Ya) (cf 82.1). Rappelons également (cf. 82.2) qu’une 
variable aléatoire T, définie sur Q, à valeurs dans NU {+co}, est un temps 
d’arrêt du processus (Y.), si, pour tout entier n > 0, l'évènement {T = n} 
appartient à la tribu 2. 

On se donne deux processus X = (X,) et Y = (Y.) {n > 0) définis sur 
un même espace probabilisé (Q,%, P). On suppose que X est adapté à Y, ce 
qui veut dire que, pour tout n > 0, la variable aléatoire X, est une fonction 
mesurable du vecteur (Y,Y1,...,YA), ou encore (cf. Proposition 1.12.1} que 
Xn est une variable aléatoire par rapport au couple (N,9,). On se donne, 
enfin, un temps d'arrêt T du processus Y. 
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On définit un nouveau processus, noté X IT — ((XIT),) (r > 0), en posant, 
pour tout n > 0, 


(8.1.1) 


AT} @) = : (rt sin < T{w); 


7 lXru(w), sin > T(w). 
On peut encore écrire : 

Xran = Xofreor + Aire ++ Xnltreny + Xaléronj. (8.12) 
Comme chacun des évènements {T = 0}, {T =1},... ,{T=n} {T >n} 
appartient à A, (cf. Proposition 2.2.1), leurs indicatrices sont des fonctions 
mesurables de (Yo, Y1,...,Yn). Comme, par hypothèse, Xo, X1,... , XA sont 
aussi de telles fonctions mesurables, le processus X IT est aussi adapté à Y. 
On l'appelle le processus obtenu en arrêtant X à l’instant (aléatoire) T. 


Donnons une autre expression pour XrA, que celle donnée en (8.1.2), qui 
est mieux adaptée pour les calculs ultérieurs. 


Lemme 8.1.1. On a la représentation : 
n1 


Xrna = Xo + D Hrery(Xeri — Xe). (813) 
k=0 


L'intérêt de cette représentation lient au fait que Tigers est une fonction 

mesurable de (Yo, ...,Y4). 

Démonstration. Tout d’abord, Xran = Xo+ D (Xxri — Xx) = Xo + 
OSR<T AR 

LE lBeTanr Ars — Xx). Comme Zgerany = Tperyl{heny €t Hpen} = 1 Si 


k=0,1,...,n—1,et 0 si k > n, on en déduit la représentation (8.1.3). 


La variable aléatoire Xr est appelée variable aléatoire terminale du pro- 
cessus arrêté X\T, Elle est définie chaque fois que le temps d'arrêt T est 
fini, ou presque sûrement fini. Cette terminologie se justifie par le fait que, 
pour presque tout w, la trajectoire du processus X IT est constante à par- 
tir de l'instant T(w) et que, sur l'intervalle {T{(w),+oal, elle prend la valeur 
(Xr)(@) = Xrçu)(w). 

Proposition 8.1.2. Si le temps d'arrêt T est presque sûrement fini, à savoir 
si P{T < +00} = 1, alors 


Xrnn ES Xr (n-— +00). 
Autrement dit, le processus X1T tend presque sûrement vers la variable 
aléatoire terminale. 


Démonstration. Pour presque tout w on à T{w) < +00. Considérons un tel w; 
alors, pour tout n > T{u), on à (Xran)(e) = Xrçyanle) = Xrtlu) = 
(rw). 0 


Remarque. Lorsque T(w) = +oo, alors, pour tout #, on à : (Xran)(w) = 
Xnlw), de sorte que le comportement asymptotique de la suite de terme 
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général (Xran)(w) se confond avec celui de la suite de terme général X,(w). Si, 
par exemple, la suite (X(w)} est convergente, on pose Xr(w) = lim Xh(w). 
On peut alors prolonger la définition de la variable aléatoire Xr, qui n’est 
définie a priori que sur l’ensemble {T < +00}, en lui donnant, sur {T = +co}, 
la valeur BLUN Xn. On obtient alors Xr = jm Xran- 

Cette opération peut être effectuée lorsque X = (X,) est une martingale 
telle que sup, E{IXh|] < +oco. Dans un tel cas, la suite (X4) est presque 
sûrement convergente. Si T est un temps d’arrêt quelconque, on a alors 
Xr = Jim Xran. 


Proposition 8.1.3. Soient X = (X,} (n > 0) une martingale (resp. une sous- 
martingale, resp. une surmartingale) par rapport à Y = (Y,) (n > 0) &T 
un temps d'arrêt du processus Ÿ. Alors le processus arrêté XIT = (Xrnn) 
(n > O0) est encore une martingale (resp. une sous-martingale, resp. une 
surmartingale) par rapport au processus Y. 

Démonstration, La représentation de Xran, qui apparaît dans le Lemme 8.1.1 
(formule (8.1.3)), permet d'écrire : 


XrAa41) — Tan = Lnery(Xn+1 — Xn), 

d’où 

ElXrA(n+#1) — Xran | Vos... » Ya] — Ell{ner}(An+i — Xn)|Yo:..., Ya] 

= T{ner} ElXn+1 — Xn | Vo, Yal, 

puisque l’indicatrice Z{n<ry est une fonction du vecteur (Yo... ,Y4). Or, si X 
est une martingale (resp. une sous-martingale, resp. une surmartingale), l’ex- 
pression E[X,41 — X4|Ÿo,...,Ÿn]) est nulle (resp. positive, resp. négative ou 
nulle). Comme l’indicatrice {ner est évidemment positive, on vérifie bien le 
fait que E[Xr4(m+1) — Xran | Yo, , Ya] est nulle (resp. positive, resp. négative 
ou nulle). [ 


8.2 LE THÉORÈME D'ARRÊT POUR UN TEMPS D’ARRÊT 
BORNÉ 
Il s’agit d'évaluer l'espérance mathématique de Xr, lorsque X est une mar- 


tingale (resp. une sous-martingale, resp. une surmartingale). Nous établissons 
d’abord le résultat, lorsque T est borné. 


Théorème 8.2.1. Soient X = (Xn) (n > 0} une martingale (resp. une sous- 
martingale, resp. une surmartingale) par rapport à un processus Y = (Y:) 
(n > 0) et T un temps d’arrêt borné adapté à Y. Alors 
E[X7] = E[Xo] 
(resp. EjXr] > E[Xol, 
resp. ElXr] < EX). 
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Démonstration, Comme T' est borné, il existe un entier M > 1 tel que 
O<T< M, d'où Xraw = Xr. D’après (8.1.3), on peut donc écrire : 
M-1 
Xr = Xrau = Xo+ DÙ Hpery (Xen — Xx)- 
k=0 


Or, pour chaque & = 0,1,...,M—-1,0ona: 
Ell{rery (ei — Xe] = EE ner (Ares — X4)|Ye,...,Yell, 


d’après la Règle 5 sur l'espérance conditionnelle (cf. 81.13). Comme l’indica- 
trice Z{,<73 est une fonction du vecteur (M,...,Y+), on peut encore écrire : 


Ellfrery (Xe — X)] = El Z{pery ELXke — Xx | Yo... Yaj]. 


Maintenant, si X est une martingale (resp. une sous-martingale, resp. une 
surmartingale), on à 


EL Xe — Xe (Vo... Ye] = 0 (resp. > 0, resp. < 0), 


d’où 
Ell{nery (Xk41 — X4)] = 0 (resp. > 0, resp. £ 0). 
Par suite, 
M-1 
EfXr] = E{Xo) + D2 EfH{ner) (Xkr1 — Xk)] 
k=0 


= EfXo] (resp. > E[Xo], resp. < E[Xo]). Ù 


8.3 LE THÉORÈME D'ARRÊT POUR LES MARTINGALES 
DOMINÉES 


Il s’agit toujours d'arriver à la conclusion E[X7] = E[Xoj, lorsque X est 
une martingale et T un temps d’arrêt, mais que ce dernier n'est plus 
nécessairement borné. On le suppose, toutefois, presque sûrement fini. On 
voit qu'avec une hypothèse supplémentaire sur le processus arrêté (XrA4) 
(condition (b) ci-dessous), on peut encore arriver à la conclusion souhaitée. 


Théorème 8.3.1. Soient X = (X,) (n > 0) une martingale par rapport à un 
processus Ÿ = (Ya) (n > 0) et T un temps d'arrêt adapté à Y. On suppose, 
de plus, que 
(a) P{T < +œ}=1; 
(b) Efsup{Xran|] < +00. 
n>0 


Alors Ef[Xr|} < +00 et E[Xr] = E[Xo]. 

Démonstration. Comme T'An est un temps d’arrêt borné, le Théorème 8.2.1 ap- ° 
pliqué au processus arrêté (Xran) implique E[Xran] = E[Xo]. Pour démontrer 

le théorème, il suffit de prouver que E[Xr1al — ElXr] et que X7 est 

intégrable. 
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Or, d’après la Proposition 8.1.2, la condition (a) implique que l’on a : 
Xran 25 Xy (n — +oo). En général, ce résultat n'implique pas nécessai- 
rement que l'on a : E[Xran] — E[Xr]. Ceci est pourtant vrai ici, mais pour 
des raisons bien précises que l’on détaille ci-après. Posons Z := suplXranl. 

n>0 


D'après la condition (b), cette variable aléatoire, évidemment positive, est 
intégrable et naturellement, pour tout n > 0, on a: |Xranl < Z. Les conditions 
d'application du théorème de convergence dominée de Lebesgue (voir [FF1}, 
chap. 10, Théorème 9.3) sont satisfaites. On peut done conclure que Xr est 
intégrable et que E[Xra] — E[Xr], lorsque n tend vers l'infini. [| 


Remarque. L'hypothèse (b) est, en particulier, vérifiée si le processus arrêté 
XIT est borné. 


Corailaire 8.3.2. Soient X = (X,) (n > 0) une martingale par rapport à un 
processus Y = (Yh) (n > 0) et T un temps d'arrêt adapté à Y. On suppose, 
de plus, que 

{a') ET] < +00; 

(b'} il existe une constante C telle que pour tout n < T on ait E[[Xn41 — 
Xnl[Yo..., Ya] SC. 

Alors E[|Xr|] < +co et E[Xr] = EiXo]. 
Démonstration. Il suffit de vérifier que les conditions (a/) et (b’} de ce corollaire 
entraînent les conditions (a) et (b) du Théorème 8.3.1. Naturellement (a') 
[EÏT] < +co] entraîne (a) [P{T < +00} = 1]. 

Posons Zo := |Xol et Zya1 := |Xey1 — Xel pour & > 0. En utilisant 
l'expression de Xra, donnée en (8.1.3), on obtient 

FXrnnt <Zo+ D TneryZrn < Zo+ D IperyZet 
o<kEn—1 0<k 
une variable aléatoire que l’on pose égale à Wet qui prend, éventuellement, 
la valeur+oo. Il en résulte linégalité sup|Xra:| < W. Pour conclure, il suffit 
n>0 


donc de démontrer que W est intégrable. 
Or, pour tout k>0,ona: 
Elf{rery Zk] = E[El rer Zrt Yo... , Ye]] 
= E(H{per}E[ Zen |Y,...,Y:)] 
{puisque I{£<r} est une fonction de (Yo... ,Y)l 


£ El[Zxer} C] [d’après (b”)] 
= CPIT > k}. 
On en tire : 
EfW] = E{Zo) + D Elf{pery Zu] < ElZo] + CSC P{T > k} 
0Sk Ok 


= E(Zo] + CE(T] < +. [] 
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Remarque. La variable aléatoire W, introduite dans la démonstration du 
corollaire précédent, majore |[Xr|. En effet, Xran 2% Xr, puisque T est 
presque sûrement fini. Ensuite, pour tout # > 0, on à : [Xranl < W. En 
faisant tendre n vers l'infini, on obtient bien | Xr| < W. 


Le prochain corollaire est en fait un cas particulier du Corollaire 3.2, qui 
s'applique dans le cas des suites de sommes partielles de variables aléatoires 
indépendantes, identiquement distribuées et centrées. Voir Proposition 7.2.5. 


Corollaire 8.3.3. Soient Yo = 0 la variable aléatoire identiquement nulle et 
(Mn) (n > 1) une suite de variables aléatoires indépendantes, identiquement 
distribuées, du premier ordre et centrées. Soit, de plus, T un temps d'arrêt 
adapté à Y = (Y3) (n > 0) tel que EÎT] < +co. Pour n > 0, on pose 
Ka Yo ++. + Mn 
Alors E[|Xr|} < +0 et E[X7] = E[Xo] = 0. 

Démonstration. D’après la Proposition 7.1.5, le processus X = (X,} (n > 0) 
est une martingale adaptée au processus Ÿ. Il suffit donc de vérifier la 
condition (b’) du Corotlaire 8.3.2. Or Yn41 = Xn+1 — XA est, par hypothèse, 
indépendant du vecteur (Yo,...,Y,). Par conséquent, pour tout n > 0, on a : 
EllXar — Xn| Yo... Ya] = Elan] = [MI] = € < +00. On voit que 
cette inégalité est même vérifiée pour tout # et non seulement pour n < T. [] 


Corollaire 8.3.4 (Les identités de Waïd). Soient Yo = 0 la variable aléatoire 
identiquement nulle et (Ya) (n > 1) une suite de variables aléatoires 
indépendantes, identiquement distribuées et du premier ordre. On pose EÏY1] = 
#. Soit, de plus, T un temps d'arrêt adapté à Y = (Ya) (n > 0) tel que 
EÏT] < +00. Pour n > 0, on pose Xn := Yo + Yi +: +Yn. 

Alors EfiXr|] < +oo et 


EfXr] = EIT]E[M]). (8.3.1) 
Si, de plus, les Y} sont du second ordre, à savoir E[Y®] < +co, alors 
T 
ES (Ya — u)?] = EÎT] Var Yi. (8.3.2) 
k=1 


Les formules (8.3.1) et (8.3.2) constituent les deux identités de Wald. 


Démonstration. On applique le Corollaire 8.3.3 à la suite (Y}), où Yj = 
0 et Yi := Yh - p (n > 1), de sorte que la suite (X}) (n > 0), où 
Xh = Yi +. + Vi = Xy — nu (n > 0) est une martingale. On a alors 
X7 = Xr — Ty. D'après le Corollaire 8.3.3, il vient : E[|X31] < +oo, d’où 
Ef|Xr!} < E[IX$1] + E[T] In} < +oo. De plus, 0 = E[X7] = ELXr] — ET}. 
Pour la seconde identité, on pose Zo := 0, puis 
Zn:= Y Cru) -no? (n>1), 
1SkEn 


où 9? = Var Y. Pour chaque n > 1, la variable aléatoire Z; est la somme de 
n variables aléatoires, indépendantes, identiquement distribuées, du premier 
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ordre et centrées. On applique de nouveau le Corollaire 8.8.3. On a : 


T 
EfiZrl]<+oo et 0=E{Zr] = E[)_(Y%-#)] ET] Var. Ù 
k=1 


8.4 UNE TROISIÈME VARIANTE DU THÉORÈME D'ARRÊT 


Dans le prochain énoncé, on s'impose de nouvelles conditions suffisantes pour 
toujours arriver à la conclusion E[Xr] = E[X0]. 


Théorème 8.4.1. Soient X = (Xx) (n > 0) une martingale (resp. une sous- 
martingale, resp. une surmartingale) par rapport à un processus Y = (Yh} 
(n > 0) et T un temps d'arrêt adapté à Y. On suppose, de plus, que 

(a) P{T < +oo} =1; 

@) E[|Xr|} < +co. 

(c) in  EUr>n) An] = 0 (resp. < 0, resp. > 0). 
Alors E[Xr] = E[Xo] (resp. > 0, resp. < 0). 
Démonstration. Pour tout n > 0 on a 

Xr — Xran = (Xr — Xran)L{reny + (Ar — Xran)H{ron} 
= Xrlirén} - Xrlçreny + Xrl{ron} — Anl{ron} 
et donc 
ELX7] = ElXran] — EXadron)] + EXT L{r>nl. (84.1) 

Appliquons le Théorème 8.2.1 pour le temps d’arrêt borné T'A n. On a : 
EfXran) = ElXo] (resp. > E[Xo], resp. < E[Xo]). Ensuite, la condition (c) 
dit que ElXnl{r>n)] tend vers 0, lorsque r tend vers l'infini. Enfin, d’après la 
condition (a) de l'énoncé, on à I{r>n} L$, 9, d'où XTH{r>n 2% 0, lorsque n 
tend vers l'infini. Par ailleurs, pour tout n > 0, on à [XrZ{r>n;l < |Xr| 
avec E[|Xrl} < +oo (condition {b)). On peut donc appliquer le théorème 
de convergence dominée (cf. [FF1], chap. 10, Théorème 9.3) et déduire que 
im EXT Iron] = Ef0} = 0. Lorsque n vers l'infini dans (8.4.1), on obtient 


bien la conclusion du théorème. [ 


Corollaire 8.4.2. Soient X = (Xn) (n > 0} une martingale par rapport à un 
processus Ÿ = (Yh) (n > 0) et T un temps d'arrêt adapté à Y. On suppose, 
de plus, que 

(8) PT <+o}=1; 

(b') il existe une constante C < +oo telle que pour tout n > 0 on ait 
Elan] < C. 
Alors EiXr] = ElXo]. 
Démonstration. Montrons que les deux conditions (a/) et (b/) entraînent les 
conditions (a), (b) et (c} du Théorème 8.4.1. D'abord (a/)}=(a). Ensuite, (a’) 
entraîne que l’on a: X4,, LS X3, lorsque n tend vers l'infini. Ce dernier 
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résultat, combiné avec la condition {b”), permet de faire usage du Lemme 
de Fatou (ef. [FF1], chap. 10, Corollaire du Théorème 9.2). On conclut que 
EX] < ©, d'où E[}Xr(] < VE[X2] < VO < +00, qui est la condi- 
tion (b). Enfin, ŒEXnlronl) = ŒlXranl{rsnl)? < E[X? 4] Eflfr-ajl par 
l'inégalité de Schwarz, soit ŒElXaltrn)l)? < CP{T > n}. Comme la condi- 
tion (a’} entraîne lim, P{T > n} = 0, la condition {c) est bien vérifiée. {] 


8.5 LE THÉORÈME D'ARRÊT POUR LES MARTINGALES 
UNIFORMÉMENT INTÉGRABLES 


Il s’agit toujours de trouver des conditions suffisantes pour que l'on puisse 
conclure que la variable X7, où (X,) est une martingale et T un temps d'arrêt, 
a même espérance que la variable X9. Dans ce dernier paragraphe, c’est la 
notion d'éntégrabilité uniforme qui est utilisée de façon cruciale. 

Définition 8.5.1. Soit (X,} (n > 0) une suite de variables aléatoires définies 
sur un même espace probabilisé. On dit que cette suite est uniformément 
intégrable si l'on a : 


lim sup EU{ix, sel Xnl] = 0. 


Comme démontré dans le lemme suivant, cette condition d'intégrabilité 
uniforme implique que non seulement les X, sont intégrables, mais que les 
espérances mathématiques des |XA| sont bornéces par une même constante. 


Lemme 8.5.1. Si la suite (X,) (n > 0) est uniformément intégrable, alors 
elle est bornée dans L!, c’est-à-dire il existe une constante M < +oc telle 
que, pour tout n > 0, on ait Ef|X,|] < M < +00. 
Démonstration. Écrivons [X,| = LHase Ant + ixaiee IX al = An + Ban, d'où 
E[|Xnt} = EfAa] + EjB,]. En vertu de l’intégrabilité uniforme, quelque soit 
e > 0 il existe une constante e{e) telle que pour tout n > 0 on ait ElA,} < €. 
Or, pour cette valeur ee) et pour tout n > 0, on a l'inégalité E{B,] < ce). 
On peut donc prendre M =#+ce{e). [] 
Lemme 8,5.2. Soient T une variable aléatoire à valeurs dans N U {+00}, 
supposée presque sûrement finie et (Xh) (n > 0) une suite uniformément 
intégrable de variables aléatoires définies sur le même espace probabilisé que T. 
Alors 

im EleronylXnl] = 0. (8.5.1) 


Démonstration. Pour tout nr > D et tout c>0,ona 
d'où Lrony = lrenyl{xsl<e + Hron)fxl>es 
Elton Aa] = Elreny Exec Xnl] + Ell{ron) Lx, ee Xl] 
= An + Bn. 
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Or, pour tout n > 0,ona B, < Ellix,|>clXnl]. De plus, d’après l'hypothèse 
d’intégrabilité uniforme, quelque soit £ > 0, il existe une constante c{e) > 0 
telle que pour tout n > 0 on ait B; < #. Prenons alors c := cs) dans 
la définition de A,. Il vient : An = EfZirsny/{xuice}lXnl} < eP{T > n}. 
Comme T est presque sûrement finie, on a a — Det donc 4, + Ba — 0, 
lorsque n tend vers l'infini. [] 


On peut alors énoncer cette dernière variante du théorème d'arrêt. 


Théorème 8.5.3. Soient X = (X;) (n > 0) une martingale adaptée au 
processus Y = (Y,) (nr > 0) et T un temps d'arrêt adapté à Y. On suppose 
que : 

(1) P{T < +00} = 1, ie. le temps d’arrêt T est presque sûrement fini; 

(2) la suite (Xh) (n > 0) est uniformément intégrable. 
Alors Ei|Xr|] < +co et E[Xr] = E[X0]. 
Démonstration. D'après le Lemme 8.5.1, pour tout n > 0, on a E{[X,|] < M, 
donc aussi Ef|Xrar|] < A4. D'autre part, puisque T est presque sûrement 
fini, on à XTan = Xr, d'où IXrnn| LS, |X71, lorsque # tend vers l'infini. 
Le Lemme de Fatou (cf, par exemple, [FF1], chap. 10, Corollaire du 
Théorème 9.2} permet de conclure que E[|Xr}} < M < +00. Les conditions 
(a), (b) et (c) du Théorème 8.4.1 sont vérifiées, puisque la condition (c) de ce 
théorème n'est autre que (8.5.1). On a donc bien E[Xr} = E[X0]. [ 


8.6 COMPLÉMENTS ET EXERCICES 


8.1 Précisions sur le Théorème 8.2.1 

Soient X = (X,) (r > 0) une martingale (resp. une sous-martingale, resp. une 
surmartingale) adaptée à un processus Y = (Ÿ,} (n > 0) et T'un temps d’arrêt 
borné adapté à Y et vérifiant 0 < T < M pour un certain entier M > 1. Alors 
E{Xo} = ELXr] = E[Xw] si X est une martingale, E[Xo] < E[Xr) < E[X»] 
si X est une sous-martingale, EjXo) > E[Xr] > EfXu) si X est une 
surmartingale. 

Pour le processus arrêté XIT = (Xr\3) (n > 0), on a les relations : 
EfXol = EfXran] = E[X4} si X est une martingale, E[Xo] < EiXran] < E[Xn] 
si X est une sous-martingale et E[Xo] > EfXran) > E[Xn] si X est une 
surmartingale. 


8.2 Calcul de l'espérance mathématique d'une variable géométrique et 
d'une variable binomiale négative 

Soit (Yh) (n > 1} une suite de variables indépendantes, identiquement 

distribuées, admettant la loi de probabilité : 460 + pe1. Pour n > 1, on pose 

Xn:i=Yi+:::+Yn. Soit T le temps d'atteinte (cf. Exercice 2.1) du processus 
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(Xn) dans l’état 1. Alors T suit la loi géométrique de paramètre p. Retrouver 
son espérance mathématique à l’aide de l'identité de Wald. 

Pour r > 1, on pose TÜ) := inf{n > 1: X, = r}, de sorte que T() =T. 
Alors T°) suit la loi binomiale négative de paramètres (p,r). Retrouver son 
espérance mathématique à l’aide de l’identité de Wald. 


8.3 Une illusion dissipée 

Pierre et Paul jouent à «pile» ou « face} avec la convention suivante : l'enjeu 
est de 1 euro par partie, Pierre parie toujours sur { pile» et décide de s’arrêter 
la première fois que son gain total sera de 1 euro. Cette stratégie est-elle 
bonne? On considère que les parties sont indépendantes, de même loi, la 
probabilité d'obtenir {pile» (resp. { face») étant p (resp. q) avec p + q = 1. 
On désigne par (Ÿ}) (n > 1) la suite des parties, la loi de chaque Ya 
étant donnée par ge_1 + pe+1. Pour n > 1, la somme X3 = Yi +...+Y 
représente le gain total de Pierre après la n°7 partie. On pose X9 = 0 et 
T:=inffn>1l:X,=1} 

{A} On suppose p = q = 1/2. 

(a) Montrer que l’on a E[T] = +00. 

{b) Comparer la convergence des martingales (X,) et 7) sur {T = +oo}. 
En déduire que l'on a P{T < co} = 1, c'est-à-dire que Pierre gagne à coup sûr. 
{Pour établir la question (b), on admet le résultat suivant : si U = (U,) est une 
martingale et si pour tout n > 1, on a U, < V, où V est une variable aléatoire 
satisfaisant E[|V|] < +00, alors la suite (Un) converge presque sûrement.] 

(c) On peut aussi établir que P{T = +00} = 0 directement, en évaluant 
la probabilité de l'évènement {T = n} (voir, par exemple, [FF1], chap. 4, 
Lemme 5.2). Pour chaque # > 0, on trouve : 


PÉT = n +1} = 1 (5) t 


Qn+iln+l)2mtt 
Alors P{T < +00}= Y P{T=2n+1}=1. 
a20 


(B) On suppose 0 < p < q. Alors P{T < +00} < 1, d'où E[T] = +co. [Pour 
n > 1, on pose Z, := (q/p}*» et Zo := 1; la suite (ZA) étant une martingale, 
on applique le théorème d’arrêt pour le temps d'arrêt borné T A n.] 

(C) On suppose 0 < q < p. Alors P{T < +00} = 1 et E[T] = 1/{(p—). [Pour 
le premier résultat, utiliser la loi forte des grands nombres avec la suite (Y,). 
Pour le second résultat, appliquer le Corollaire 3.4 avec le temps d’arrêt T'An, 
pour démontrer : EÎT' An) < 1/(p—g). La conclusion EÎT] = 1/(p—a) s'obtient 
alors par application du Lemme de Fatou (ef. [FF1], chap. 10, Corollaire du 
Théorème 9.2).] 


Chapitre 9 


Problèmes de ruine 


On se propose dans ce chapitre de traiter deux exemples de problèmes de ruine 
à l’aide de la théorie des martingales développée dans les chapitres précédents. 
Ii s’agit tout d’abord du problème de la ruine d’une compagnie d'assurance, 
et ensuite du problème classique de la ruine du joueur. 


9.1 RUINE D'UNE COMPAGNIE D’ASSURANCE 


Les sinistres susceptibles de se produire et devant être couverts par une 
compagnie d'assurance ont un double aléa : d’abord, l'instant où ils se 
produisent, ensuite, le montant de dédommagement qu’il faudra débourser, 
autrement dit, le coût du sinistre. On désigne par X une variable aléatoire, à 
valeurs strictement positives, représentant ce coût. On suppose qu'elle est du 
second ordre et on pose # = E[X], o? = Var X < +00. 

On se donne, ensuite, 

(a) une suite (XA) (n > 1} de variables aléatoires indépendantes, iden- 
tiquement distribuées comme X ; 

(b) un processus de Poisson { Né) : # > 0}, de densité À > 0, indépendant 
de la suite (X}) (n > 1). Le pararnètre À est le nombre moyen de sinistres par 
unité de temps. 

Nü) 
La somme aléatoire Y1 := 32 X; est alors le coût des sinistres par unité de 
1 
temps et d’après les identités de Wald, on a : 


= EM] = EÏN(D]E[X] = 4; 
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puis, 
ol := Var M = EIN(L)]E([X?] = A{u? + 02). 
On considère alors une suite (Y,) (n > 1} de variables aléatoires indépen- 
n 
dantes, identiquement distribuées comme Y1. La somme C(n} := 32 Y4 est 
k=1 
alors le coût total des sinistres enregistrés dans l'intervalle [0,n] (n > 1). On 
introduit encore deux autres notions : 
(c) la disponibilité à la date n : D{n) := R+ Pn, où R est la réserve et P 


est le {aux d'entrée des primes par unité de temps. 
(d) la trésorerie à la date n : 


n 
D(n)-C(n)=R+Pn-C(n)=R+Y(P-Y). 
k=1 

On introduit le temps d'arrêt : T := inf{n > 1 : D(n) — C{n) < 0}; c'est 
le premier instant où la trésorerie de la compagnie est négative ou nulle. La 
probabilité P{T < +oo} est la probabilité de ruine de la compagnie. Faisons 
l'hypothèse que la loi de Yi est la loi normale Nu, 1), où y est très petit 
comparé à P. Nous nous proposons de majorer cette probabilité de ruine. 


Proposition 9.1.1. On a l’inégalité : 


P{T < +00} < sp(-e M) x) = exp(-22@ — M, (9.1.1) 


X(&2 + 0?) 
Nous donnons deux démonstrations de cette Proposition, qui font appel 


à deux méthodes différentes. Il est remarquable que ces deux méthodes 
conduisent à la même majoration. 


9.1.1 Majoration par la méthode des temps d'arrêt 


Pour k& > 1, posons Z4 := P — Y}, de sorte que 


D(n)-Cfn)=R+ DZ (r 21). 
k1 


Comme P est une constante, la suite (Zx) (n > 1) est une suite de variables 
aléatoires indépendantes, identiquement distribuées comme 71 = P—Y., donc 
de loi NP — 1,01). Or, ia fonction génératrice des moments de Z1, dont 
l'expression est donnée par 


ou) = Ee"2] = expu(P pu) + A), 


prend la valeur 1, lorsque = wo := —2(P — ju)/o? < O0. D'après la 
Proposition 7.3.1, on peut former la martingale de Wald associée à la suite de 
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terme général D(n) — C{n). Cette martingale est donnée par : 


Wolu) = e*#, 
Go = er eMZite+2n)  euiD(n)-C(n)) M>0 
Wu) = ————— = ———— (21) 
” g(u)* UOE : 
2(P — 
Pour w = üg = en on obtient la martingale : 
Î 


Wo := exp( 20H p), 


gi 
mo exp PE (DG - GG) (n 2 D. 


L’instant aléatoire TAm (m > 1) est évidemment un temps d’arrêt borné pour 
la martingale (W,) (r > 0). On peut donc appliquer le Théorème d'arrêt 8.2.1 
EiWo] = ElWramj: 
soit 
2(P — 
exp(— er) = E[Wriçrém}l + ElWm{r>m}] 
H 


> ElWrlirem}]- 


Or, la trésorerie DoT — C'oT à l'instant T est évidemment négative ou nulle. 
D'où Wr > 1 et ainsi 


nn) > Ellfrem}} = P{T < m}. 


L’inégalité étant satisfaite pour tout m > 1, on obtient la majoration (9.1.1), 
en faisant tendre m vers infini. {] 


9.1.2 Majoration à l'aide des inégalités maximales 


Dans cette méthode, on fait appel à l'inégalité suivante, démontrée dans Le 
chapitre 10 (cf. Théorème 10.2.1), qui dit que si (Xn} (n > 0) est une sous- 
martingale positive, alors pour tout À > 0, on a la majoration 


ÀP{ sup X4 > À} < E[X,}. (9.1.2) 
OSkER 


n 
Puisque Yi suit une loi normale N(y1,01), le coût total C{n) = Y Yx dans 
ÉA 


l'intervalle [0,7] peut s’écrire C{n) = yun + o1Un, où U, est une variable 
aléatoire normale, centrée, d’écart-type 4/n, donc de fonction génératrice des 
imoments g(u}) = eun/2, D'après la Proposition 7.3.1, la suite (X,}, où Xo := 1 
et 

etUn 


SE = en) (n>1), (9.1.3) 


Xn := 
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est la martingale de Wald associée à (U,). [Il faudrait dire : associée à la suite 
((Ma — 1)/01).] Comme les deux évènements 


{ sup (Ur — uk/2) > b} et { sup X4 > e} 
OSkEn o<kEn 


sont équivalents et que E[X4] = 1, la majoration (9.1.2) avec u =: 2a et 
À := e2%b fournit l'inégalité : 
P{ sup (Ur — ak) > b} < e72%. (9.14) 
OSkEn 


Prenons n > 1; l'évènement “la compagnie est ruinée durant l'intervalle 
{0,n][” est l'évènement Lt (D(k) — C(k)) < 0}. Comme D(k) — C(k) = 
<REn 


R+(P —ym)k— o1Ûx, il s'exprime encore comme 
{R sup (ok — (P — pu}k) < 0} = { sup (ox — (P — 1)k) Z R} 
OSkEn D<kEn 
= { sup (Ux — ak) > b}, 
OSkER 


en posant a := (P—yw;}/o1 et b := R/o1. Conservant ces deux valeurs de a 
et b, la majoration (9.1.4) fournit alors l'inégalité : 


P{ inf (DE) — C{)) < 0} < er. 


Comme cette inégalité est uniforme en n, on en déduit la majoration suivante 
de la probabilité de ruine de la compagnie 


PR), 


oi 


P{inf(D(n) — C{n)) < 0} < e7%%? = exp{ 


une majoration qui est identique à celle trouvée par la première méthode, 


9.2 LE PROBLÈME DE LA RUINE DES JOUEURS 


La théorie des chaînes de Markov permet de traiter ce problème, une fois 
résolues certaines équations de récurrence. Il existe une autre méthode de 
résolution faisant appel aux résultats développés jusqu'ici sur les martingales, 
utilisant notamment le théorème d'arrêt. Nous nous proposons d'exposer cette 
méthode. 

Rappelons que dans le problème de la ruine des joueurs, on suppose que 
deux joueurs À et B jouent un nombre illimité de parties indépendantes, 
l'enjeu étant de 1 euro par partie : si À gagne la n°°°% partie, il donne un 
euro à B et réciproquement. La probabilité que le joueur À (resp. B) gagne 
une partie donnée est p (resp. q) et on suppose : 0 < p < 1, p+q= 1. Pour 
n > 1, on désigne par Y, le gain de À à la #7 partie et l'on pose Yo := 0 et 
Xn:= Yo+Y+::+Y, (r > 0). On suppose encore que la fortune initiale 
de À est de a euros et celle de B de b euros, où a,b > 1. 
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Dans ces conditions, la suite (Y.) (n > 1) est une suite de variables 
aléatoires, indépendantes, chacune de loi ge_1 +pe41. De plus, X, représente 
le gain réalisé par À au cours des # premières parties. Après La nièTe bartie, la 
fortune de À est a + X}, celle de B de b— X,, tant que ces quantités restent 
positives. On définit donc un temps d'arrêt T du jeu comme étant 


Ti=minfr>1:Xn=-a ou X, = +b}. (9.2.1) 


La variable aléatoire T est évidemment un temps d’arrêt adapté à (Y,) 
(n > 0), puisque c'est le temps d'atteinte du processus (X,) (r > 0) dans 
l'ensemble {—a, b}, qui s'exprime comme une fonction des seules variables Yo, 
Misc Ya. 


Proposition 9.2.1. Quelle que soit la valeur de p (0 < p < 1), le temps 
d'arrêt T est presque sûrement fini. 
Démonstration. 

(1) Casp=q= L Les variables aléatoires Y, (n > 1) sont alors centrées. 
On peut utiliser la Proposition 7.1.5 pour dire que la suite (X,) (n > 0) est une 
martingale par rapport à (YA) (n > 0). Or la série de terme général Y, est non 
convergente, puisque son terme général ne tend pas vers 0. Considérons alors le 
processus arrêté X [7 = (Xran). C’est une martingale (cf. Proposition 7.1.3). 
De plus, pour tout r > 1, on à : —a < Xran < b. D’après le Théorème 11.11, 
sur la convergence des martingales, la martingale X IT converge presque 
sûrement. Or, sur l'ensemble {T = +00}, les martingales X et X IT coïncident, 
la seconde converge presque sûrement, mais non la première. Pour lever cette 
contradiction, on doit conclure que P{T = +00} = 0. 


(2) Cas p # q. D’après la loi forte des grands nombres, on a : 
X, Vito :+Ÿn ps. 
= A SE i] =p-q#0. 


Donc Xn 2 +oosip—qg>0et X, 25 — 00 si pq < 0, ce qui suffit pour 
montrer que P{T <co}=1. [ 


9.3 LA PROBABILITÉ DE RUINE 


Le temps d'arrêt T' étant presque sûrement fini, on peut considérer la variable 
aléatoire Xr. C’est le gain (algébrique) de À lorsque le jeu s'arrête. Ti ne prend 
donc, presque sûrement, que les valeurs — à (ruine de A) et b (ruine de B). 
On pose 

Ta=P{Xr=-a} et r:=P{Xr=b}. (9.3.1) 


Comme r4 + ro = 1, la loi de Xr est ainsi raca + (1 — ra)ee. L’espérance 
mathématique de Xr vaut : 


E[Xr] = ra(—a) + (1 ru)b. (9.3.2) 
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9.3.1 Cassp=q= L 


La suite (X,) (r > O0) est une martingale. De plus, elle satisfait les 

conditions d'application du Théorème d'arrêt des martingales dominées 

(Théorème 8.3.1}. D'abord, T est presque sûrement fini, puis sup|Xran| < 
n>0 


max{a, b}, d’où Efsup{Xran|] < oo. Il en résulte E[Xr] = E[Xo] = 0, d'où, 
n2>20 


d’après (9.3.2), , 
Lens (9.3.3) 


9.3.2 Casp £q 

Comme E[Y1] = pq # 0, la suite (X,) n'est plus une martingale par rapport 
à (YA). On peut cependant construire une autre martingale, qui permettra 
d'évaluer r,. Posons, en effet, 


D'=1, Zi= OR (n>t). (9.3.4) 


Lemme 9.3.1. La suite (ZA) (n > 0) est une martingale par rapport à (Y:) 
{n > 0). C’est, en fait, une martingale de Wald par rapport à (YA) (n > 0). 
Démonstration. En effet, on a glu) := Efe"Yi] = pe“ + ge". D’après la 
Proposition 7.3.1, la suite Zo := 1, Z, := gu) "eut tn) (n > 1) est 
une martingale (de Wald) par rapport à (Y}) (n > 0), pourvu que & # 0. 
Prenons une valeur de u # 0 telle que g{u) = pe“ + ge * = 1. En posant 
v:= et, il s'agit de résoudre l'équation pu? — v + g = 0. En écartant la 
solution v = 1, on trouve la solution v = e* = q/p. Pour n > 1, on peut donc 
prendre : Zn = (g/p}*. Q 


Comme Zr = (g/p}*T, la loi de Zr est donnée par 
l'a Etape + (1 — ra) Etap 
et son espérance mathématique par 


ElZr] = ra Oo) +0 (1) (9.3.5) 


Une nouvelle fois, le théorème d’arrêt fournit la valeur de ia probabilité 
de ruine r.. Vérifions, en effet, que les hypothèses du Théorème d'arrêt 8.3.1 
sont satisfaites pour la martingale (Z,) (n > 0). D'abord, P{T < +oo} = 1, 
d’après la Proposition 9.2.1. Ensuite, Zran = (g/p}*T4 est borné pour 
n > 1, puisque Xrx ne prend qu’un nombre fini de valeurs. Il en résulte 
que E[|sups>alZrant} < +00. D’après le théorème juste cité, on en conclut 
que EfZr] = Elo} = 1, d'où, d’après (9.3.5), re(g/p)79 + (1— ra)(g/p} = 1 


et donc «y pu 
1-(£ 1-(2 
= 1" = 2 Q (9.3.6) 
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9.3.3 Le jeu avec un adversaire infiniment riche 


Supposons que la fortune du joueur B est infiniment grande, mais que celle 
du joueur À est toujours a < +oo. Dans le cas p = q = 4 la formule (9.3.3) 
entraîne que lorsque b tend vers l'infini, r, tend vers 1. La ruine de À est 
certaine. 

Supposons p < g. Lorsque b tend vers l'infini, la formule (9.3.6) entraîne 
que ra tend vers 1. Même conclusion. 

Supposons p > g. Lorsque b tend vers l'infini, la formule (9.3.6) entraîne 
que ra tend vers (g/p}°. Dans ce cas, la probabilité de ruine de À est d’autant 
plus faible que sa fortune initiale a est plus grande. 


9.4 LA DURÉE DU JEU 


Conservons les notations des paragraphes 2 et 3. Nous nous proposons 
d'évaluer la durée moyenne du jeu, E[T], jusqu'à la ruine de l’un des joueurs. 


9.4.1 Casp = q= 4 


Supposons que l’on sache que EÏT] est finie. La formule de Wald donne 
EfXr] = E[T}EfM}, mais comme E{X7] = EfYi] = 0, on ne peut rien 
conclure sur EfT}. Or, nous savons (cf Exercice 7.1) que la suite (22) 
(n > 0), où Za := 0 et Zn := X2 — n est une martingale par rapport à 
(a) (n > 0). Appliquons-lui ie théorème d’arrêt pour le temps d’arrêt borné 
T A n (Théorème 8.2.1). Hi vient : 


0 = EfZo] = ElZran] = ElX fan] — EIT An]. (9.4.1) 
Proposition 9.4.1. On a : E[X2] = E[T]. 
Démonstration. Comme T est presque sûrement fini, Xran + Xr, d'après la 
Proposition 8.1.2; donc aussi X24, PS, x2. Comme la suite (Xran) (n > 0) 
est bornée, la suite (X2,,) (n > 0) l’est aussi. D’après le Théorème de 
convergence dominée de Lebesgue, E[X2,,] — E[X3]. D'autre part, comme 
T est presque sûrement fini, la suite (T An) est une suite monotone croissante 
tendant presque sûrement vers une limite finie 7. D’après le Théorème de 
convergence monotone, il vient EÎT An} — EIT!. Il suffit donc de faire tendre n 
vers l'infini dans la formule (9.4.1) pour conclure. [| 


D’après cette dernière proposition, on a donc : E[T] = E[XA] = ra(—a)? + 


b 
(ra)? = es FA + T5? = ab. La durée moyenne du jeu est égale au 
a œ 
produit des fortunes initiales des deux joueurs : 


EÏT] = ab. (2.42) 


Cette durée est considérablement plus longue que ce que lon pourrait penser. 
Pour a = b = 500 euros, elle est de 250.000. Pour a = 1 et b = 1000, elle est 
de mille parties. 
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9.4.2 Casp £q 


La formule de Waid donne EfX7} = E[T]E(":1] = EfT](p — q). Comme 
p—g % 0, on pourrait en déduire ia valeur de E[T] si l’on savait, a priori, 
qu’elle était finie. On peut s’affranchir de cette hypothèse en procédant comme 
suit. 

La suite (X,) (n > 0) n'est pas une martingale, mais la suite (ZA) (n > 0), 
où Zn = Xn — nu, avec u := E[Mi} = pq, en est une. On lui applique le 
théorème d'arrêt pour le temps d'arrêt borné T A n (op. cit.) et l’on obtient : 

0 = EfZo) = EfZran] = ElXran) — EÎT A njy. (94.3) 


On reprend alors la même démonstration que celle de la Proposition 4.1 
pour se convaincre qu’en faisant tendre n vers l'infini dans la formule (9.4.3), 
on à : E[T] = lim, E[T À n] = lim E[Xran] = E[Xr]. Ceci montre, d’abord, 
que E[T] est finie. Ensuite, la relation 


Ejn] = SEX (9.44) 
ra =0) + (= 08) = EE (a+ bre), 


donne la formule E[T] = 


soit, d’après (9.3.6), PT 
p\ê 
1—{é 
b a+b (G) 
ET) = — - rer 94.5 
ME pra (2) (45) 
q 
Cette formule est invariante dans la transformation {a,p) + (b, a) : 
1) 
gp = 2 -2+b (94.6) 


ap 2-1 (a; 
? 


9.4.3 Le jeu avec un adversaire infiniment riche 


Il s’agit d'étudier le comportement de la durée du jeu EfT], exprimée en 
fonction de a, b,p,g, lorsque a est fixé et & tend vers l'infini. 

Dans le cas p= q = à, la relation (9.4.2) donne : E[T] —> +00. Le joueur À 
joue un jeu équitable avec un adversaire infiniment riche. Sa ruine est certaine, 
mais il a la consolation d’obliger son adversaire à jouer pendant une durée 
d'espérance mathématique infinie, avant qu'il soit ruiné! 

Lorsque p < q, la relation (9.4.5) donne : E[T] —+ a/(g—p}. Le joueur À est, 
à chaque partie, en désavantage contre un adversaire, qui est, en plus, infini- 
ment riche. Sa ruine est certaine et se produit après une durée d'espérance 
inathématique finie. 

Enfin, lorsque p > q, la relation (9.4.6) donne : E[T} — +00. Le joueur À a 
l'avantage à chaque partie; la probabilité de sa ruine n’est pas certaine (elle 
est égale à (g/p)* (cf. $9.3)). La durée du jeu est d'espérance mathématique 
infinie. Il faut que le joueur ferraille bien et longtemps! 
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9.5 COMPLÉMENTS ET EXERCICES 


9.1 On reprend pour les suites (YA) et (XA) (n > 0) les définitions données 
dans le paragraphe 9.2 pour le problème de la ruine des joueurs. On suppose, 
de plus p # g. On démontre directement, sans faire appel au Lemme 3.1, que 
la suite Zo := 1, 2, := (g/p}%* (nr > 1) est une martingale par rapport à (YA). 


9.2 On reprend les mêmes notations que dans les paragraphes 9.2-9.4. On 
suppose b > 1 et l’on désigne par s := a+ b la fortune totale initiale des deux 
joueurs. Soit g(a, s) la probabülité pour le joueur À de gagner la somme 5. On 
note Smax la valeur de s qui maximise la probabilité g(a, s). Dans les deux cas 
P = k et p  q, on trouve : Smax = &+1, mais le calcul n’est pas ie même! 


9.3 « Audentes fortuna juvat » 

Toujours dans le problème de la ruine des joueurs, où l'on pose s := a +b, 
il s’agit de savoir si en misant chaque fois (1/x) euros au lieu de 1 euro 
{0 < æ < 1), le joueur À a plus de chances de convertir sa fortune initiale a 
en s. On convient aussi que le joueur B mise aussi (1/x) à chaque partie. 
Soit G(x) la probabilité pour le joueur À de gagner la somme s. Dans le 
cas p = q = à, on trouve G{x) = a/s et dans le cas p # q, on trouve 
G(x) = (1 — p)/(1 — p%), en posant p := q/p. Sia>1,b>1letp>l1,la 
fonction G(x) est une fonction croissante de la mise (1/x). Le joueur À doit 
donc choisir la plus grande mise possible, compatible avec sa fortune. 


9.4 On considère une suite {Y;) (n > 0) de variables aléatoires, indépen- 


dantes, de même loi, celle-ci étant donnée par g£_1+pe+1. Les entiers relatifs 
æ,c € Z étant fixés, on pose : 


Si:=t, Sixt te +WM(n>1), T: 
Dans le problème de la ruine des joueurs, on peut interpréter x comme la 
fortune initiale du joueur À et S7 comme sa fortune après la n°7° partie et 
TE comme le premier instant où sa fortune est égale à c. 


(a) Étant donné d € Z tel que c < x < d, on évalue P{T® < T£}, qui est la 
probabilité, partant de x, d'atteindre c avant d. On trouve : 


inf{n >0:5%=c}. 


d—-x . 1 
Te sip=;; 
PT < TD ge 
(pas SPFE 


On vérifie que P{TE < TE} + P{TF < TE} =1. 
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{b) On pose y4 := inf{r > 1: S% = x}; c’est le premier instant où la 
fortune de À est de nouveau égale à x. Alors P{y4 < +00} = 2 min{p,q}. 
(c} On pose M := sup S9 et m := is. Ce sont les valeurs extrêmes 
n>0 2 
de la fortune de À au cours du jeu, lorsque sa fortune initiale est 0. Lorsque 
p < q (resp. p > q), la variable aléatoire M (resp. m) suit une loi géométrique. 
Trouver les expressions. Prolonger les calculs aux cas de M := sup S7 et 
mé = US s 


9.5 Doubler la mise 
Soit (Xh) (n > 1) une suite de variables aléatoires, indépendantes, toutes 
de loi : HO + €41). Cette suite représente les parties successives d’un jeu 
de (pile? ou «face» effectuées par un joueur. Au départ, ce joueur parie 
1 euro, s’il gagne, il a retrouvé sa mise et s’arrête. S'il perd, il joue une 
seconde fois, mais parie cette fois 2 euros; si le résultat lui est favorable, 
il empoche sa mise et s'arrête de jouer. Il retrouve donc sa fortune initiale : 
—1 +2 = 1 euro. S'il perd encore la seconde fois, il joue une troisième fois, 
mais en pariant 2? = 4 euros. S'il gagne cette troisième partie, il empoche 
la mise et retrouve ainsi son bien : —1 — 2 +4 — ], et ainsi de suite... S'il 
a perdu (n— 1) parties, mais gagne la n°", avec cette stratégie, il à donc 
perdu : —1-2-—22-...-2-1, mais comme il parié 2° la ni fois, il retrouve 
sa fortune : —1—2—922-...-90-140n =, Pour nr > 1, on désigne par X; le 
gain total (algébrique!) du joueur après la 7°" partie, en convenant que s’il 
gagne la 4° partie utilisant cette stratégie, on a : Xh = 1 pour tout k> n. 
On pose Xo := 0. 

{a) Déterminer la loi de X, et son espérance mathématique. 

(b) La suite (X,) (n > 0) est une martingale par rapport à (XA) (n > 0). 

(c) On pose : T := inf{n > 1: X, = i}. C’est donc le nombre de parties 
que doit jouer le joueur pour retrouver sa fortune en utilisant la stratégie 
décrite. Alors T est un temps d'arrêt adapté à (X,) (n > 0). Déterminer sa 
loi de probabilité; en déduire que P{T < +co} = 1. Montrer que le théorème 
d’arrêt n’est pas vérifié. Quelle est l'hypothèse du Théorème 8.3.1, à savoir le 
théorème d'arrêt pour les martingales dominées, qui n’est pas satisfaite ? 

(d) Si la probabilité d'obtenir {pile» n’est plus 4 mais p (p # È et que 
le joueur joue toujours “pile”, la suite (X,) est une sous-martingale ou une 
surmartingale suivant que p > L oup< L 


Chapitre 10 


Les inégalités maximales 


Les inégalités dites maximales sont valables pour les martingales et sont fort 
utiles dans les applications. Elles font l’objet du présent chapitre. 


10.1 LES INÉGALITÉS DE BIENAYMÉ-TCHEBYCHEV ET DE 
KOLMOGOROV 


Soit Yo la variable aléatoire identiquement nulle et (YA) (n > 1) une suite 
de variables aléatoires, indépendantes, identiquement distribuées, centrées et 
du second ordre. On note Var 1 = 0? la variance de Y1. On pose, de plus, 
Sn = Yo+Yi+..+Yn (n > 0), de sorte que pour tout n > 1, on a : E[S,] = 0 
et Var 5h = no. 

L'inégalité de Bienaymé-Tchebychev (cf. [FF1], chap. 8, Proposition 8.1) 
s'écrit : 


Ve>0 eP{[S] > e} < E[S2] = no?. (10.1.1) 
L'inégalité de Kolmogorov s'exprime comme suit : 
Ve>0 e?P{ max [Se] > €} < E[S?] = no?. (0.1.2) 
OSkEn 


Il y a des démonstrations élémentaires de l'inégalité (10.1.2). Nous verrons 
qu'elle est une conséquence de l’une des inégalités maximales que nous allons 
établir. D’après la Proposition 7.1.5, la suite (S,) (nr > 0) est une martingale 
par rapport à (Y,) (n > 0). D'après l’Exercice 7.10, la suite (2) (n > 0) 
est alors une sous-martingale positive par rapport à (Y,) (r > 0). En fait, 
l'inégalité (10.1.2) se généralise à toute sous-martingale positive. 
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10.2 LES INÉGALITÉS POUR LES SOUS-MARTINGALES 
POSITIVES 


Théorème 10.2.1. Soit (X,) (n > 0) une sous-martingale positive. Alors 


< . .2. 
VA>0 AP{mex Xi > À} < E[Xa] (10.2.1) 
Démonstration. Posons M, := {max X4 > À} = U {X4 > À} et 
OSKER O<kEn 


introduisons le temps d'arrêt T, qui vaut min{k : 0 < k < n, Xx > )} 
sur M, et n sur M£. C’est bien un temps d'arrêt du processus (X,); de plus, 
il est borné (par n}, de sorte qu’on a : Xran = XT. 

Appliquons le théorème d’arrêt pour les temps d’arrêt bornés (Théo- 
rème 8.2.1) à la sous-martingale (X,) (n > 0) et au temps d'arrêt TAn=T. 
On a: 

ElXa} > E[Xran] = E[Xr] 
= ElXre,] + EXT ue] = EfXrlne,] + E[Xn lue) 
> EXrlu,] [puisque la sous-martingale (XA) est positive] 
> ÀEfu,] = AP(M). © 


Corollaire 10.2.2. Soit (X,) (n > 0) une martingale. Alors 
VA>0 ÀP{ max [Xul > À} < E[|XA]. (10.22) 
OSkEn 


Démonstration. En effet, si (X,) est une martingale, alors (|XA|} est une sous- 
martingale positive. [] 


Corollaire 10.2.3. Soit (Xn) (n > 0) une martingale telle que pour tout n > 0 
on ait E[X2?] < +00. Alors 
VA>0 XP{ max [X4] > X} <EX2?]. (10.2.3) 
OSkEn 


Démonstration. Avec les présentes hypothèses, on sait que (X?) (n > 0) est 
une sous-martingale positive. Donc 


2 < 2 
VA>0 AP{ max X8 > À} < E(X3] 
Avec la substitution À + }2?, on obtient bien la relation (10.2.3). [ 


Remarque. Reprenons la martingale (S,) (nr > 0) introduite dans le para- 
graphe 1. Si on lui applique la relation (10.2.3), on obtient l’inégalité de Koï- 
mogorov (10.1.2). 
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10.3 LES INÉGALITÉS MAXIMALES POUR LES 
SOUS-MARTINGALES DE SIGNE QUELCONQUE 


Théorème 10.3.1. Soit (X,) (n > 0) une sous-martingale de signe quel- 
conque. Pour n > 0, soit My l'évènement {ex X7 > À}. Alors 
CREER 


VA>0 AP(M) < El Xulu, | € EUX] < EljXul]. (10.31) 


Démonstration, Il suffit de démontrer la première inégalité, les deux autres 
étant triviales. Reprenons la démonstration du Théorème 10.2.1. Le théorème 
d'arrêt permet d'écrire E[Xn] = EXz1,] + ElXnlmel > ElXr/m,] + 
ElXaluel, d'où ElXalu,) > EXT] > AP(Ma). Ù 
Coroilaire 10.3.2. Soit (X,} (n > 0) une martingale. Alors 

VA>0 AP{ max [ul > À} < EUX max l>ar (032) 


Démonstration. En effet, si {X,) (nr > 0) est une martingale, alors (|X:i} 
(n > 0} est une sous-martingale. [|] 


Corollaire 10.3.3. Soit (X,) (n > 0) une martingale telle que pour tout n > 0 
on ait E[X?] < +oo. Alors 
2 
vVA>0 PE max IX > À} <EIX 2 lue l>ax (033) 


Démonstration. En effet, si (X,) (n > 0) est une martingale, alors (X2) (n > 0) 
est une sous-martingale et l'on a : 


2 2 
Va>0 AP{qmex Xé >À}< EUX Le max XE s xt 


Il suffit de faire la substitution À <— X? pour obtenir la relation (10.3.3). 


On sait (cf. [FF1], chap. 11, Théorème 4.5) que si X est une variable 
aléatoire positive, son espérance mathématique {dans [0,+o0]) admet aussi 
l'expression : {© P{X > «} dr. On a un résultat analogue pour les moments 
d'ordre supérieur, comme établi dans le prochain lemme. 


Lemme 10.3.4. Soit U une variable aléatoire positive. Alors, pour toutn > 1, 
one: 


EU") = n Î Pa PAU > 2} dr. (10.3.4) 


Démonsiration. En effet, d’après le théorème précédemment cité, on a : 
EjU?] = ft P{U* > u} du = [jf ® P{U > ul/"} du; d'où la formule (10.3.4) 
en faisant le changement de variables ul/® =x, [ 


150 10 » Les inégalités maximales 


Corollaire 10.3.5. Soit (XA) (n > 0) une martingale telle que pour tout n > 0, 
on ait E[X?] < oo, Alors 


Ef(rnax (XI) < 4x4. (10.3.5) 


Démonstration. On pose À, := ge [Xx|, qui est donc une variable aléatoire 


positive. D’ après le Corollaire 10.8.4, pour n — 2 et U — A,, il vient : 
EfA2) = 2 °° y P{A > y}dy. Comme, d'après le Corollaire 10.3.2, on à 


Vy>0 yP{Ai > 9} SEXalT4, > y} 
on en déduit : 
E(A?] e2f EUXalT4, > y} 


Soit Px la loi de probabilité du vecteur X := (X0,...,Xn). En posant 
:.,%n), OR à : 


EX l4, > = fou Ella, > y} C9 dPkC9. 


Par suite, les fonctions à intégrer étant positives, 


En < 2 [7 (lent To, > 39 dk 69) dr 
+00 
= 2[.. EnldEx (x) f. Lan s 470 dy: 


+00 


+00 an 
d’où, puisque À Tan s y} 09 dy = f La > y}@) dy = f dy = ans 
la majoration 
EJAË] < 2 fl, lrnlen d'x(x) = 2E( IX) 4] 


<2YE[X1E[ 4], 


d'après l'inégalité de Schwarz. On en déduit donc la majoration (10.3.5). [] 


Donnons encore une variante de l'inégalité maximale pour les sous- 
martingales de signe quelconque. 


Théorème 10.3.6. Soit (X,) (n > 0) une sous-martingale. Alors 
VA>O0 ÀP{ de Xx < —h} < E[X}] - E[Xo]. 
na 


Démonstration. Soient À l'évènement {eg min Xx < —à} et T le temps d'arrêt 
défini par : 

Ti=min{k:0<k<n, X<—A}la+nlae. 
Appliquons à la sous-martingale (XA} (nr > 0) le théorème d'arrêt pour le 
temps d'arrêt borné T' An (cf. Théorème 8.2.1). 
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On obtient : E[Xo) < E[Xran] = E[Xr] = E[Xr 14] + E[Xn Zacl < — EE 4) + 
E[Xh Lac] = —ÀP(A)+E[X a Jp-xex, 0} lac] EX a l{x,>0y lac] < —AP(A)+ 
EIX*]. 0 


10.4 LES INÉGALITÉS MAXIMALES POUR LES 
SURMARTINGALES 


Nous donnons deux énoncés, un pour les surmartingales positives et un autre 
pour les surmartingales de signe quelconque. 


Théorème 10.4.1. Soit (Xn) (n > 0) une surmartingale positive. Alors 
< . .4. 
VA>0 AP{mex Xe > À} < EfXo] (10.41) 


Démonstration. Soient À l'évènement { max X3 > À} et T le temps d'arrêt 
défini par : 9Sk£n 
T:=min{k:0<Ek<n, Xg > À} Ia +nlae. 


Appliquons à la surmartingale (X,} (n > 0) le théorème d’arrêt pour I 
temps d'arrêt borné T A n. On obtient : E[Xo] > ElXrar] = E[X7] 
EfXr Ia] + E[X» Tac]. Puisque les X, sont positifs, on en déduit : E[Xo} 
ElXr la] > AP(4}. 


& 


W Il 


Remarque. L'inégalité (10.4.1) est uniforme en n. En faisant tendre n vers 
l'infini, il vient : 


VA> 0 AP{max Xe > À} < E[Xal. 


Théorème 10.4.2. Soit (X,) (n > 0) une surmartingale de signe quelconque. 
Alors 


VA>0 ÀP{ min X4 < —X} <EX*] - EX]. (104.2) 
OSk<En 


Démonstration. Soient À l’évènement { min X4 < —À} et T le temps d'arrêt 
défini par : DER 


T:=min{k:0<k<n, Xr <—ÀA}I4a+nlae. 


Appliquons à la surmartingale (X,) (n > 0) le théorème d’arrêt pour le 
temps d'arrêt borné T A nr. On obtient, en utilisant l'inégalité EfXo] > 
EfXran) > E[X}], démontrée dans l'Exercice 8.1 : E[X}] < EfXran]) = 
EfXr] = EfX7 Jai + EX Lac] € -XP(4)+E[X;] 
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10.5 INÉGALITÉS DE NORMES 


Pour tout réel p > 1 et toute variable aléatoire U/, on pose 


ul := (fier ar) = (eriurr)"e. 


Soient U, V deux variables aléatoires définies sur le même espace. On a utilisé 
précédemment l'inégalité de Schwarz : 


(ELU VI] < EVE. (0.5.1) 
soit encore 
(RAAPES TARA (10.52) 
On utilise aussi plus loin l'inégalité de Hôlder sous la forme suivante : soient 
p, g deux nombres réels strictement positifs tels que m + à = 1. Alors 
LATEST A RAT (10.5.3) 


soit encore 
E[IU vi] < (EUUP]) (EVA). (10.54) 


Soit (Xh) (n > 0) une sous-martingale positive. Posons U := max X4. 
D'après le Théorème 10.3.i, on a les relations : SRE 


Vy>0 yP{U > y} < EX usyl. (10.5.5) 
Soit p un nombre réel tel que p > 1 Comme, d'après le Lemme 10.3.4, 
+00 
Eur = [pr PAU > vds, 
0 
on en déduit : 
+® 
eur < [m7 EX usé. 
Posons ü := CEE, %* etx:= (%o,...,Æn), puis notons Px la loi de probabilité 
n 


du vecteur X := (X9,...,XA). Alors, 
El Log] = [ a En Ton C9 dx (x), 
% 
d'où 
EU’ < Î pp” dy [ a En Jtuyi() dB). 
R+ mt 
Les fonctions à intégrer étant positives, on a, par le théorème de Fubini, 


EU] < fs ce dPx(x) | Pa?" Tuoy}() dy 
Rat R+ 


= La an d'Ex(x) [arar 
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soit encore 
EfU7] = D Leu ul dPx(x); 
d’où 
EjUP] < EE uP-1]. (10.5.6) 
Prenons maintenant un nombre g > 1 tel que : + 1 = 1 et appliquons 
linégalité de Hôlder (10.5.4) au membre de droite de (10.5.6). On obtient : 
EjIXn UP] < (E[AR) 7 (ELU). (05.7) 
Comme q = p/(p — 1}, on déduit de (10.5.6) et (10.5.7), l'inégalité : 
EfU*] < a (ELXH)/P (ELU?) Ve. 
Si E[UP} est fini et non nul, on en déduit l'inégalité 
ŒIUP) P < a(E[Ur])/, 
soit 
LAPETAR AS (10.5.8) 


Si E{U?] = 0, l'inégalité (10.5.8) est triviale. Si E[U?] n’est pas fini, on 
considère la variable aléatoire bornée U A c, de manière à obtenir [U A «||, < 
4||Xrllp. On fait ensuite tendre e vers l'infini, pour obtenir (10.5.8) de nouveau. 
Récrivons le résultat obtenu sous forme de théorème. 


Théorème 10.5.1. Soient (X,) (n > 0) une sous-martingale positive et p un 
nombre satisfaisant p > 1. Alors 


7 
Lagex Xule < 2 Xe lp. (10.59) 


Remarque. Si (X,) (n > 0) est une martingale, alors (|X,[} (n > 0) est une 
sous-martingale positive et le précédent résultat s'applique. On à donc : 
P 
< ——— 
Poe, Ka le < 2 Xl 
ou encore 


Epoax Du] (EE) EP 


Corollaire 10,5.2. Soient (XA) (n > 0) une sous-martingale positive et p un 
nombre satisfaisant p > 1. Alors 


P 
lue Xuh < Xe. (10.5.10) 


Si (Xn) (n > 0) est une martingale, ee 


loge Aallh < En Île (10.5.11) 
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Démonstration. Si X est une variable aléatoire positive, l'application p + 
IX est croissante. Pour tout p > 1, on en déduit | X|1 < |X|L,. Enfin, 
si (Xn) (n > 0) est une martingale, on sait que (|XA|) (n > 0) est une 
sous-martingale positive. [] 

Donnons un dernier résultat pour la norme ||---||1. On pose : 


Logæ, siæ>1; 
Toi BE; 2 15 
Log 2e {6 sz<l 


On observe (cf. Exercice 10.6) que pour «> 0etb>0,ona: 


b 
a Logb < a Log*a + = (10.5.12) 
Théorème 10.5.3. Si (X,) (n > 0) est une sous-martingale positive, alors 
€ + 
1 ges Xuli < 2 (+ EUX Log Xn]). (10.513) 
Si (Xn) (n > 0) est une martingale, alors 
; e n 
1 gex Xl < (+ ELA Log * IX). (05.19 


Démonstration. L'inégalité (10.5.13) entraîne (10.5.14) en utilisant l’argu- 
ment désormais classique! Pour (10.5.13), posons U := maxo<s<en X&. Alors 
EU] = GPU > y}dy = A+ B, avec À := fS P{U > y}dy < 1 et 
B:= fŸ%P{U > y} dy. Or, d'après (10.3.1), pour tout y >0,ona: 


y PEU > y} < EX Hu>yl. 
D'où B < fi (1/y) EX n Jul du. Comme 
EX Huy = Î ge 2 Li dPX (am) 


où uw := max æ et où Px est la loi de probabilité du vecteur X = 
o<kEn 


(Xo,.… , Xn), on obtient, par le théorème de Fubini, 


+00 L 
B<] 34 fs da Huy dPX(E0.2n) 


+00 7 
= Le En dPx(&o, sn) Î guou dy 


= uns En T{u>1} LogudPx(to,...,tn), 


soit, d'après (10,5.12), 
u 
B< fe (an Log tn + 5 Tux dPx(o,...,&n). 
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On en tire 
B < EUX Log* Xi] + feu u ua dPX (F0: 2) 
< EX, Log *X,]+ SEUIL 
D'où 
E[UI = A+ B 
<1+E{X Lost X,] + LU, 
soit 


(- LJeu) £1+E{X4 Log*X4]. Ù 


10.6 COMPLÉMENTS ET EXERCICES 


10.1 Soit (X4) (n > 0) une martingale telle que pour un certain p > 1 et tout 
n > 0 on ait E[|X[P] < +oo. Alors 


Ve>0 eP{ max (Xl > €} < EjXaf 


10.2 Soit (X,) (n > 0) une martingale telle que pour tout n > O0 on ait 
E{X;] = 0 et E[X?] < +oo. Alors 


fx] 


Pme XR> AIS DA 


10.3 Suites de moyennes expérimentales 

Soit (XA) (nr > 1) une suite de variables aléatoires, indépendantes, identique- 
ment distribuées, centrées, telles que E[|X2i} < +oo pour tout # > 0. Pour 
n > 1, on pose 5, := X1 +. + Xh, Y, := Sn/n et on note H, la suite 
Hu = (Sn Sutts.). 

(a) La suite (Y,) (n > 1) est une martingale renversée par rapport à 
la suite (H,) (n > 1), c'est-à-dire la suite (...,Mn,Ya_1,...,Ÿ1) est une 
martingale par rapport à la suite (...,H,,H,_1,...,H1). Autrement dit, on 
a: Elan] Hn4i] = ax. 

(b) Pour tout n > 1 et tout À > 0,on a: AP{max el > À} SEM]. 


10.4 Partant de l'inégalité maximale (10.2.1), on démontre directement 
l'inégalité (10.5.10). 
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10.5 Soit (Y:) (n > 1) une suite de variables aléatoires indépendantes, 
identiquement disribuées, centrées et du second ordre. On pose : Y := 0, 
Ef[Y?] := 0? < +00 et Sn = Yo +Y1+--"+ Yan pour n > 0, de sorte que, pour 
tout # > 0, on à EfS,] = 0 et Var S, = no?. On à la généralisation suivante 
de l'inégalité de Kolmogorow : 


2 2 
Ve>0 € P{max lSkl >e}< EISR max Su] sel 


08, siz>l; 
se : +g: ; ; 
10.6 On pose : Log *x : { Sz<l, 


; 
Pour a > 0 et b > 0, démontrer l'inégalité : 


a Logb < @ Log ‘a+ à 


Chapitre 11 


Théorème de convergence 


Dans le théorème de convergence des martingales, on donne une condition 
suffisante pour qu’une martingale converge vers une variable aléatoire, qui 
soit intégrable. La technique de démonstration du théorème fait appel à 
un argument de comptage. Il s’agit de compter le nombre de fois qu'une 
trajectoire traverse une bande horizontale et de majorer ce nombre. 


11.1 LE THÉORÈME DE CONVERGENCE 


Théorème 11.1.1. Soit (XA) (n > O) une martingale bornée dans L!, c’est- 
à-dire telle que, pour une certaine constante e > 0, on ait : 


supE{|Xai] < e. 114) 
n20 


Alors la suite (X,) (n > O0) converge presque sûrement vers une variable 
aléatoire intégrable X.. 

La démonstration utilise un lemme dû à Doob sur la majoration de la 
moyenne des traversées d’une bande horizontale par la suite (X,}. Pour définir 
cette notion, nous supposons donnés deux nombres a, b tels que a < b et 
introduisons la suite S1 < T1 < 52 < Th < --. des temps d'arrêt suivante : 

S:=inffn>0:X,<a}, inf{n > Si:X, > b}, 

S:=inf{fn > Ti:Xn <a}, inffn > S2:Xn > b}, 
et ainsi de suite. Si l’une des bornes inférieures n’existe pas, on donne la 
valeur +oo au temps d’arrêt correspondant, ainsi qu'aux suivants. Dans la 
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Figure 11.1, on a représenté une trajectoire n + XA par des croix “x”. Les 
temps d’arrèt S1,T1,S2,... sont représentés par des gros points “e”. 
La variable aléatoire 


M = Ÿ Irsctoo} (1.1.2) 
k>1 
est le nombre total de traversées de [a,bl, en montant, effectuées par la 
trajectoire n + Xh. 
4 
x 
x x 
x x 
b 
X x 
* 
x] : 
& 
| * 
XX 


+— +- > 
0 1 2 8 4 6 6 T 8 9 8211 T 18 14 15 $s 17 18 T3 20 


FIGURE 11.1 


Lemme 11.1.2 (Inégalité de Dubins). Pour tout k > 1 et toutn >1l,ona: 
(a) P{Tk < n} < Ef(a — Xn) scnenyl: (112.3) 
Démonstration. L'entier n étant fixé, posons 
De := Xrynn — Xgyan. 

D’après ie théorème d’arrêt appliqué aux temps d'arrêt bornés T, An et SkAn, 
on voit que : E[D4] = E[X1} — E{X1] = 0. D'autre part, on a les implications 
in<S}={Di=0}; {R<n}={Dr2b-0} 

{SR <n<T}= {Di= Xn- Xs,} = {De > Xn a}; 

qu’on peut résumer en écrivant : 
(— a) Timeny + (Xn — a) Hspenery € De. 
En prenant l'espérance mathématique des deux membres, on obtient : 
@—a)P{Tk < n} +E[(Xn — a) T{syener,y] < ElDxl =0. 0 


Lemme 11.1.3. (Lemme de Doob). Conservant les notations {11.1.1) et 
(11.12), on a la majoration : 
lal + ce 


EM] < E—. (11.14) 
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Démonstration. L’inégalité de Dubins (11.1.3) permet d'écrire 


@-a) 5 P{T <n} < D El(e - Xn) Hsieneri}le 
k>1 &>1 


Or, les évènements {S, < n < T4} (k > 1) sont disjoints deux à deux; 
notons À leur réunion. Comme {54 < n < T}} = Ÿ dès que & > n, on peut 
écrire : 
DE Xx) Hsscnenyl = D El(a — X) H{sseners)] 
> 1SRER 
= E(a — Xn), Z Hissnenil 


= E(a — X, L 
[Ca DE {sxeneTi}l 


= Ef(a— Xx){a]; 
d'où 
(b— a) SI P{T < n} < Ef(a — X:)IA]. 
k>1 
Maintenant, on a les majorations : Ef(a — X,)14] < IEl(a — X,)* 74] < 
Ef(a — X,)*] < la] + c, d’où, pour tout n la majoration D P{T, < n} < 
KE1 


A:= (lai + c)/(b— a). D'autre part, E[M] = Y P{T < oo}. Si l'on avait 
Er 
E{M] > À, on aurait aussi 3 P{T; < +00} > A pour un certain K > 1. 
1SREK 


Comme, pour tout k > 1, on a P{T4 < +00} = lim, P{Ty < n}, on aurait 
ZX P{Tx <n}> À pour n assez grand, à fortiori >} P{T, < n} > À, ce 

1LSk<K k>1 

qui contredit la majoration prouvée pout tout n. [| 


Lemme 11.1.4, La suite (Xn) (n > 0} est presque sûrement convergente. 


Démonstration. Pour indiquer que la variable aléatoire M dépend du couple 
(a,b), on pose : M := Mas. C’est une variable aléatoire positive et l'inégalité 
(11.14) montre qu'elle est intégrable. Elle est donc presque sûrement finie, ou 
encore l'évènement {M,,5 = +co} est négligeable. La réunion dénombrable 


U {Map = +0} 
abEQ.a<b 


est aussi négligeable. Or, l’évènement {liminf, X, < a < b < limsup, Xn} 
entraîne qu’il y a une infinité d'indices n tels que {X, < a} se produise et qu'il 
y à aussi une infinité d'indices n tels que {X, > b} se produise également ; ce 
qui implique alors que l'évènement {M,,5 = +00} se réalise. On a donc 


im inf Xn <a<b<limsup X}} € {Map = +00}. 
n 
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D'où 
{liminf X, < limsup X,} = (8) {liminf X, < a < b < limsup X,} 
Lu ” ebeQacb ” d 
(es Ü {Mas = +00}. 
a,b€Q, a<b 


L'évènement {liminfn Xn < limsup, XA} est donc négligeable, ce qui signifie 
que la suite (XA)} (n > 0) converge presque sûrement. [] 


Fin de la démonstration du Théorème 11.1.1. Ïl reste à démontrer que la suite 
(X2) (r > 0} converge presque sûrement vers une variable aléatoire intégrable. 
Cette propriété résulte du Lemme de Fatou (ef. [FF1], chap. 10, Corollaire du 
Théorème 9.2). 

En effet, d’après le Lemme 11.1.4, la suite (X4) converge presque sûrement, 
disons, vers une variable aléatoire X.., d’où [XA| 25, IXool. Ensuite, pour tout 
n > 0, on a Ef|X,|] < e. Les deux conditions du Lemme de Fatou sont 
remplies et on peut conclure que l’on à aussi E[[X.{] <c. [ 


Remarque 1. La démonstration du Théorème 11.1.1 reste valable, si X est 
une surmartingale. En effet, on a alors E[D,] < 0 et les inégalités restent 
toutes dans le même sens. Pour vérifier l'inégalité E[D,] < 0, on utilise le 
fait que, pour une surmartingale admettant deux temps d'arrêt S, T tels 
que 8 < T, alors E[Xs] > EfXr|]. Intuitivement, on comprend que, pour 
une surmartingale, on puisse majorer le nombre de traversées en montant, 
puisqu’une surmartingale a tendance à décroître. 


Remarque 2. Si X est une sous-martingale, alors —X est une surmartin- 
gale. À toute traversée en montant de [a,b] par la surmartingale —X cor- 
respond une traversée en descendant de [—b,—a} par la sous-martingale X. 
Le Théorème 11.1.1 appliqué à la surmartingale —X fournit alors une majo- 
ration pour le nombre de traversées en descendant de [--b, a] par la sous- 
martingale X. Le Théorème 11.1.1 reste donc encore valable aussi pour une 
sous-martingale. 


Corollaire 11.1.5. Une martingale de signe constant (resp. une surmartingale 
positive, resp. une sous-martingale négative ou nulle) est presque sûrement 
convergente. 


Démonstration. Démontrons le corollaire pour une martingale positive. On 
a, pour tout n > 0 les relations E[[X,|] = E[X,] = ElXo] < +00 et 
le Théorème 1.1 s'applique. Pour une surmartingale positive, E{|X,|] = 
EÏXa] < E[Xo] < <+oo et pour une sous-martingale X < 0 , il vient : 
EflXal]= -ElXai < —E[Xoi < +00. [ 
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11.2 MARTINGALES UNIFORMÉMENT INTÉGRABLES 
Rappelons qu’une suite de variables aléatoires (X,) (n > 0) est uniformément 
intégrable (cf. chap. 8, $5), si 

ln sup El{ixu>elXnl] = 0. (112.1) 


Donnons, d’abord, quelques conditions suffisantes pour qu'une suite de 
variables aléatoires soit uniformément intégrable. 


Proposition 11.2.1. Soient (X,) (n > 0) une suite de variables aléatoires 
et Z une variable aléatoire positive, intégrable, telles que pour tout n > O0 on 
ait |X}] < Z. Alors la suite (X,) (n > 0) est uniformément intégrable. 


Démonstration. Pour tout c > 0 et tout n > 0,on a 
ElxselXnl] < ELZ Liz 
donc, pour tout € > 0 
supr Elyx,1>olXnl] < E[Z Zz>ol. {1122) 


Or, puisque Z est positive, on a : limh E[Z J{z<n3] = Ellimn Z H{izeny) = 
EÏZ] < +oo. Donc, pour c assez grand, le membre de droïte de fes) est 
arbitrairement petit. [] 


Proposition 11.2.2. Supposons que pour un certain « > 0 et pour tout n > 0, 
il existe une constante finie K telle que El|X\|1+2] < K. Alors, la suite (Xn) 
{n > 0) est uniformément intégrable. 


Démonstration. On fait appel ici à l’inégalité de Hôlder sous La forme : 
EIXYI] < ŒIIXT DA ŒiY lp, 


où r et s sont deux nombres supérieurs à 1 tels que (1/r)+(1/s) = 1. Prenons 
r:= 1+a. Alors, l'inégalité de Hôlder donne : 


Elx>olXnl] < EUX D ŒEixse D 
< KW (PIX > e})/* 


£ 
<KVr { Star ve [par l'inégalité de Tchebychev} 
K\ws_ _K 
1 = 
SAW (5) Tafs 


Comme r/s > 0, la dernière fraction est arbitrairement petite pour c assez 
gand. [ 


La prochaine proposition est la réciproque de la précédente. 


Proposition 11.2.3. Si (X,) (n > 0) est une suite de variables aléatoires 
uniformément intégrable, alors sup, EÎ|Xx|] = X < +oo. 
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Démonstration. En effet, pour tout c > 0 et tout n > 0,ona 
EFXa |] = Elf{xsice)Xnl] + El Zgxu1>e} nl] 
£e+Elx>glXnl} 
d'où, pour tout c > 0, 
sup El Xn]] < € + sup, E[Hxt>elXall. 
Comme ln supn El {x 1>e}lXnl} = 0, on peut trouver un nombre C > 0 tel 
que sup, ElZ{x,1>c}lXnl] © 1, d'où sup, E[X}]]| <C+1 [0 


La prochaine proposition est donnée sans démonstration. 


Proposition 11.2.4. Étant donnée une suite de variables aléatoires (X:) 
(n > 0), les deux propriétés suivantes sont équivalentes : 

(a) la suite (X,) (nr > 0) est convergente en moyenne d'ordre 1 vers une 
variable aléatoire X intégrable ; 

(b} Xn + X et la suite (Xu) (n > 0) est uniformément intégrable. 

Il faut noter que la propriété d’intégrabilité uniforme est exactement la 
propriété qui fait défaut à la propriété de convergence en probabilité pour 
entraîner la convergence en moyenne d'ordre 1. 

Le corollaire suivant est une conséquence directe des Propositions 11.2.1 
et 11.24. 


Corollaire 11.2.5. Soit (Xn) (n > 0) une suite de variables aléatoires telles 
que pour tout n > © on ait |X}| < Z, où Z est une variable aléatoire 
intégrable. Alors la convergence en probabilité est équivalente à la convergence 
en moyenne d'ordre 1. Un cas particulier important est le cas où la suite (X) 
{nr > 0) est bornée. 


Théorème 11.2.6 (Théorème de convergence pour les martingales uni- 
formément intégrables). Soit (XA) (n > 0) une martingale uniformément 
intégrable. Alors il existe une variable aléatoire intégrable X, telle que 

(e) X PS Xe ; 

(b) Xn — Xs (en moyenne d'ordre 1), ie. E[|Xx — Xo[] — 0. 
En outre, pour tout n > 0, on à : E[X,] = E[XA]. 
Démonstration. D’après la Proposition 11.2.3, l'hypothèse du Théorème 1.1 est 
vérifiée, On à donc X, 2% Xoo, d'où Xn >, X5. D'après la Proposition 2.4, 
on à donc aussi X, — X,, en moyenne d'ordre 1 et X, est intégrable. Alors 
IEfX»] — ElXoo]| < E[|Xr — Xoo[] — 0. D'où E[X,] — E[X.]. Or, la suite 
{Xn) (n > 0) étant une martingale, la suite (E[X,]) (n > 0) est constante. On 
a donc : E[X+] = E[Xh]. [ 


Le prochain théorème indique le tien étroit qui lie intégrabilité uniforme 
et martingale de Doob. Auparavant, nous établissons, d'abord, un lemme 
de continuité absolue, qui est une conséquence du théorème de convergence 
monotone de Beppo Levi {ef. {FF1], chap. 10, Théorème 10.1). 
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Lemme 11.2.7. Si Z est une variable aléatoire intégrable, alors, si P(A) tend 
vers 0, on a Ef[Za|Z|] — 0. 

Démonstration. En effet, E[{,z,<n31Z}] tend en croissant vers E[|Z[], d'après 
le théorème de Beppo Levi. Si £ > 0 est donné, il existe N tel que E[|Z|] < 
Ell{zienyZ|] + €. Prenons À tel que P(4) < e/N, ce qui implique que 
Ellal{zeny 121} < NE[Z4) = NP(4) < €. Alors 


EflalZ1] = Elalgaen 121] + ŒUA171} - Ellalizieny ZI) 
£<e+E{[2}] -El{zen|Z1 <2e. 0 


Théorème 11.2.8. Soit (X,) (n > 0) une martingale par rapport à une suite 
(Ma) (mn > 0}. Alors les deux propriétés suivantes sont équivalentes : 

(a) (Xn) (n > 0} est une martingale de Doob, ï.e. # existe une variable 
aléatoire intégrable Z telle que pour tout n > 0 on ait Xh = E[Z |Y0,...,Y]; 

(b) (Xx} (n > 0) est uniformément intégrable. 
Démonstration. Supposons (a) satisfait et faisons l'hypothèse Z > 0, le cas 
général, que nous ne traitons pas, s'en déduisant en considérant Z = Z*-Z-. 
Dans ce cas, les variables aléatoires X, sont positives. 

D'abord, appliquant les règles de l'espérance conditionnelle, 


Ex,» Xn] = Ex,» E(Z | Yo... , Yai] 
= Ex. 71%... al] 
= Ellix,se Z]. (11.23) 


En particulier, en prenant, par exemple, c= —1, on obtient E[X,] = E{Z]. 
D’après l'inégalité de Tchebychev, pour tout n > 0, on a : 


1 
P{X, > c} < JEUX] = LEZ], 
d'où 1 c 
suph PEXA > ec} < = EZ], 
et donc 
SR SUP P{X, > c} = 0. (11.24) 


Donc, quel que soit r >0,ona ie, PEXa > c} = 0, ce qui entraîne, d’après 
le Lemme 11.2.7, que im EMtxs>c Z] = 0, ou encore, d’après (11.2.3), que 
im EUtause Xa] = 0. D'où AU sup, Ell{x,»e} Xn] = 0. La suite (XA) 
(n > 0) est donc uniformément intégrable. 

Réciproquement, supposons cette dernière condition satisfaite. D’après le 
Théorème 11.2.6, il existe une variable aléatoire intégrable X, telle que 
E{iXx — Xo|] — 0. Nous nous proposons de démontrer que, pour tout n > 0, 
on a: Xn = E[X | Yo,..., Ya]. I suffit donc, d’après la Proposition 1.13.7, de 
démontrer que, pour tout entier n > 0 et tout évènement À € Æ(Y0,...,Yn}, 
on a : E[ZaX4] = EflaX]. 
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D'après la Proposition 7.2.4, pour n et k > 0,ona: 
EfXn+r | Vos... Yal = ELXa 1 Vos... Ya. 
D'où 
EUaäal = EUAELXa | Fos al] = EUAEUX at | Yo, Val] 
= E[EUAX axe | Vos... Ya] = EfaXnel. 
La suite de terme général E[/4X,] est donc constante. Comme [Ella X»] — 


Ella Xool| € E[1Xn — Xoo] et que lim E[|Xa — Xool] = 0, la suite de terme 
général E[Z4X}] tend vers E[Z4X]. D'où E[T4Xn] = Ella Xoo]. 
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11.1 Une martingale de Doob est presque sûrement convergente 

Une variable aléatoire Z vérifiant E[}Z|] < oo, étant donnée, ainsi qu’une 
suite de variables aléatoires (Y,) (n > 0), toutes définies sur le même espace 
probabilisé que Z, on à posé X, := EfZ }Y0,...,YA] pour tout n > 0 (cf 87.2) 
et démontré que la suite (X,) (n > 0) est une martingale, dite martingale 
de Doob. Alors la suite (XA) converge presque sûrement vers une variable 
aléatoire X. 


11.2 Soient Z une variable aléatoire telle que E[|Z|] < +oo et (Xn) (n > 0) 
une martingale par rapport à une suite (Y,) (n > 0) telle que, pour tout 
n > 0,on ait X, < Z. Alors, la suite (X,) (n > 0) converge presque sûrement. 
{Considérer la martingale de Doob (E[Z|Y,...,YAl) (n > 0). 


11.3 Soit M le nombre de traversées en montant de l'intervalle [a,b] d’une 
martingale (X4) (n > 0), comme défini en (11.1.2). Conservons les notations 
du paragraphe 1. Alors, Travz := {Sx < +00,7} = +oo} est l'évènement 
“la trajectoire n + X, admet (k — 1) traversées en montant et la KM est 
seulement amorcée”. On a l'inégalité 


Vk>1 (b—-a)P{M > k} < El(a — Xa) Zrrav, Je 
[Appliquer l'inégalité de Dubins à la martingale arrêtée X |" 


114 Soit (Ÿ:) (n > 1} une suite de variables aléatoires indépendantes, 
identiquement distribuées, à valeurs positives, du premier ordre, de loi non- 
dégénérée (à savoir, LM) # e1) et vérifiant E[Yi} = 1. Pour chaque n > 1, 
on pose : À, = Li Ye. 


(a) La suite x) (n > 1) est une martingale positive par rapport à (Y,) 
(Rz1). 
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{b) D'après (a), la suite (X,) (n > 1) converge presque sûrement. De plus, 
Xa #0 lorsque n tend vers l'infini. [Distinguer deux cas : P{Y1 = 0} > 0 et 
P{Y = 0} = 0. 


11.5 Modèle de Polyà 
À la date 0, une urne contient une boule blanche et une boule noire. À la 
date 1, on prélève une boule, on note sa couleur, puis on la remet dans l’urne, 
avec une boule supplémentaire de même couleur. On itère cette opération aux 
dates 2, 3, ... Soit N, (n > 0) le nombre de boules blanches dans l’urne après 
la ne opération. 

{a) La suite de terme général X, := M est une martingale par rapport 
à (Na) (a > 0). n+2 

(b) Le rapport du nombre de boules blanches au nombre de boules noires 
converge presque sûrement vers une limite. 


Chapitre 12 


Exemples d’applications 


On se propose, dans ce chapitre, de donner cinq exemples d’applications de la 
théorie des chaînes de Markov et des martingales. Les processus de branche- 
ment font l’objet, en général, d’une étude spécifique. Il paraît intéressant ici 
de voir comment les résultats sur les chaînes de Markov et les martingales 
s'appliquent dans ce cadre. La loi de Hardy-Weinberg, qui est traitée ensuite, 
fournit une application inattendue en génétique. On verra également que le 
battage des cartes peut s’interpréter commodément dans le cadre des chaînes 
de Markov. Enfin, une extension du traditionnel problème du scrutin, ainsi 
que celui du collectionneur de vignettes, trouvent une solution élégante dans 
le cadre des martingales. 


12.1 PROCESSUS DE BRANCHEMENT 


On considère une particule qui donne naissance à un nombre aléatoire X de 
particules de même espèce. On pose m := E[X] et l’on suppose 0 < m < +00. 
On fait l'hypothèse que chaque particule de la première génération donne 
naissance, à son tour, à un nombre aléatoire de particules de même espèce, 
ces nombres aléatoires étant indépendants et tous de même loi de probabilité 
que X. Les particules de la deuxième génération se reproduisent de nouveau 
et ainsi de suite. On désigne par YA (n > 0) le nombre de particules de la 
nie génération. On suppose Yo := 1. Autrement dit, la génération initiale 
est formée d’un seul individu. 


Lemme 12.1.1. On a : EfYa] = m" (n > 0). 


168 12 e Exemples d'applications 


ième 


Démonstration. Notons X(*){i) le nombre de particules produites par le À 
parent de la nŸ génération. Les variables aléatoires X(*)(1), X()(2), 
sont indépendantes, identiquement distribuées, de loi commune £(X). Le 
nombre de particules de la (n +1)" génération est alors donné par la somme 
aléatoire : Yayi = X09 (1) +... + XU)(Y,). D'après l'identité de Wald, on a 
donc : EfYh41] = EfY,]E[X] = EfYa]m (n > 0) et enfin E[Y;] = mm. [l 


Lorsque n tend vers l'infini, le comportement asymptotique de E[Y,] se 
déduit directement du Lemme 12.1.1. Suivant que m > 1 ou que m < 1, le 
nombre moyen Ef[Y;] tend exponentiellement vers l'infini ou vers 0. Il reste 
constamment égal à 1 sim=t. 

Notons que si m < 1, on a Y EfYh] = À m" = 1/{1—m), une quantité 

n>0 n>0 


qui représente l'espérance mathématique du nombre total d'individus issus de 
lancêtre commun de la génération 0 (cet ancêtre étant compris) et ce nombre 
est fini. 


Lemme 12.1.2. La suite (Y;) (n > 0) est une chaîne de Markov, homogène. 

Ce lemme est évident, car le nombre de particules de la (nr + 1)" généra- 
tion ne dépend que du nombre de particules de la niè" génération; il est, de 
plus, indépendant de n. 


Lemme 12.13. On pose : Z, := Yn/m” (n > 0). Le processus (Z3) (n > 0) 
est une martingale par rapport à (Y,} (n > 0). 

Démonstration, D'après le Lemme 12.1.1, on a : Ef|Zl] = EfZ,] = 1 < 
+oo pour tout n > 0. Il résulte, ensuite, du Lemme 12.1.2 que l’on a : 
Eau (16 = do Y = él = Eeule = à] = EXC) ++ 
XP) (i,)] = EX] = nm, ce qui implique E[Ye+1 1 Yo... , Ya] = Yam, 
c’est-à-dire, en introduisant la variable aléatoire Z,, l'identité recherchée : 
EZnn Ve. Vel = G/m Eau | Vo. Ye] = Ya/mr = 24 D 


Remarque. Le fait que (Z,) (r > 0) soit une martingale permet d'établir 
directement que l'on a E[Y.] = m", puisque E[Z,] = E[Zo} = 1. 


Lemme 12.1.4. La suite (Zn) (n > 0) converge presque sûrement vers une 
variable aléatoire limite, positive, intégrable Z. Sim > 1, la suite (Y:) 
{n > 0) croît exponentiellement lorsque n croît sur l’ensemble des w où Z 
est strictement positif. 

Démonstration, D'après le Lemme 12.1.3, la suite (Z,) (n > 0) est une 
martingale positive. D'après le Lemme 12.1.1, on a EfZ,] = 1 pour tout n > 0, 
d’où supy>g É[Zn] = 1 < +co. La suite (Zn) (n > 0) converge donc presque 
sûrement vers une variable aléatoire limite, positive et intégrable, en vertu du 
Théorème 11.11. [ 


Soit maintenant (p0,p1,...) la loi de probabilité de X. On se propose 
d'étudier la nature des états de la chaîne de Markov (Y;) (n > 0) en fonction 
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de cette loi de probabilité (cf. Lemme 12.1.2). Notons P = (p;,;) ((à, 5) € N?) 
la matrice de transition de cette chaîne, de sorte que 


pag = Peur = [Ya =} = PLAN) +5 XD) 2 GE 
D'abord, si p1 = 1, chaque particule admet, avec une probabilité égale 


à 1, exactement un descendant, et par conséquent Y, — 1 p.s. Ce cas est 
inintéressant. On suppose donc, dans la suite, 1 < 1. 


Proposition 12.1.5. L'état O est absorbant, donc récurrent (extinction). 


Démonstration. Si Y, = 0, alors Y,41 = 0, de sorte qu’une fois que le processus 
atteint 0, ilyreste. [| 


Proposition 12.1.6. Si p1 < 1, alors tout état à > 1 est transient. 
Démonstration. On distingue Les cas : po = 0, po = 1 et 0 < po < 1. 

(a) po = 0. Alors chaque particule a au moins un descendant, de sorte que 
la suite (YA) est croissante. Si on part de à, à la date n, on retournera au moins 
une fois dans i, si et seulement si chacun des 4 membres de la n#"® génération 
admet exactement un descendant. D'où, avec les notations (5.6.6) : fi; = 
PAP = ilY = = PLX() = 1,..,X00){i) = 1} = (pi)f < 1 L'état à 
est transient. 

(b) pa = 1. Alors pi = 1, de sorte que f;; = 0 < 1 et à est transient. 

{c} 0 < po < 1. Puisque O est absorbant , on a : 

fui S P{Veu É#0ÏMæi}=1- P{Yuu = 0|Ye =} 
=1-P{X0 0) 2 0,...,X 0) (5) = 0} = 1 (po) < 1 
et i est encore transient. [| 


Proposition 12.1.7. Avec une probabilité égale à 1, le processus (YA) s'éteint 
ou explose, soit P{Y, — 0 où Ya — +oo} = 1. 

Démonstration. Prenons un nombre entier N > 1. Puisque les états 1,2,...,N 
sont tous transients, après un certain temps, le processus (YA) ne les visitera 
plus. Après un certain temps, on aura donc, ou bien Y, = 0, ou bien 
Ya > N +1. Comme N est arbitraire, on a le résultat. [| 
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On considère une population d’individus dont chacun possède une paire 
spécifiée de gènes, dite génotype, chaque gène pouvant être de type À ou a. 
Initialement, on connaît le pourcentage des individus dont la paire de gènes 
est de type AA (ou 1), Aa (ou 2), aa (ou 3). En considérant le génotype 
comme une variable aléatoire, on suppose donc connue la loi de probabilité 
initiale du génotype, qu’on écrit sous la forme : (0 = (u,2v,w), u,v,w > 0, 
u+2u+uw=i. 
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Quand deux individus se croisent, chacun fournit un de ses deux gènes, 
avec une probabilité 4 à son descendant. On admet également que, dans un 
croisement, chaque individu a la même probabilité d’être choisi. La probabilité 
pour que, lors d’un croisement, un individu pris au hasard fournisse le gène À 
est p = u+ 20 = u+vuetg= 120 + w = v+w pour qu'il fournisse 
le gène a. On note Xo le génotype d'un parent initial, X1 le génotype du 
descendant de la première génération, ... , X, le génotype du descendant de 
la nième génération. 

On convient que le nombre d'individus est grand, de sorte que si l'on retire 
un individu quelconque de la population, la proportion des génotypes dans la 
population restante n’est pas modifiée significativement. 


Proposition 12.2.1. La suite (X,) (n > 0) est une chaîne de Markov, 
homogène, ayant E = {1,2,3} comme ensemble des états, ® comme loi 
initiale et P pour matrice de transition, donnée par : 


1 2 3 
1{p q 0 
P=2|p/2 1/2 g/2|. 
3\0 p ag 
Démonstration. Si Xo = 1, pour avoir X1 = 1, il faut croiser l'individu 


initial avec un individu de génotype AA (probabilité u) ou un individu de 
génotype Aa (probabilité 2), d'où par = u+v = p. Pour avoir X3 = 2, 
il faut croiser avec un individu de génotype Aa (probabilité 2vt = v} ou 
un individu de génotype aa (probabilité w), d'où p1,2 = v + w = q. Ainsi 
ps = 0. Si Xo = 2, pour avoir X1 = 1, il faut croiser avec un individu 
de génotype AA (probabilité u) où un individu de type Aa (probabilité 
go2v = v/2. D'où por = hu + EU = p/2. Pour avoir X; = 2 à partir de 
Xo = 2, il faut croiser avec un individu de génotype AA (probabilité lu), ou 
avec un individu de génotype Aa (probabilté 24420 = v), ou encore avec un 
individu de génotype aa (probabilité kw), d'où pas = du +v+ Lu = L Les 
autres coefficients s’obtiennent par symétrie. 


Proposition 12.2.2 (Loi de Hardy-Weinberg). Pour tout n > 0, soient X, le 
génotype à la ne génération et y) la loi de probabilité de XA. Alors, quelle 
que soit la loi de probabilité initiale (0) = (u, 2v,w), pour tout n > 1, on a 
pt) = {p?,2pa,d°), avec p = u+v, 4 = v+w. En d'autres termes, la loi de 
probabilité du génotype est stationnaire à partir de la première génération. 
Démonstration. En effet, uU) = {OP = (p?,2pq, q?) et lorsque l'on itère 
encore une fois : (p?, pq, q°)P = (p?,2pq,q°). [] 
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12.3 LE BATTAGE DES CARTES 


Considérons un jeu de n cartes et convenons que l’ordre initial des n cartes 
correspond à la permutation identique (1,2,...,n). Après battage, le pa- 
quet se trouve dans un autre ordre, caractérisé par une permutation & = 
(d1,02,...,8n) de la suite initiale. Chaque battage fait donc passer d’une 
permutation « à une permutation 7. On convient que ces ni différentes per- 
mutations sont les n! états dans lesquels le paquet de cartes peut se trouver. 
Une transition d’un état o à un état 7 est définie de la façon suivante : on 
prend la carte située au-dessus du paquet et on l’insère dans le paquet restant, 
dans l’une des n places possibles. Il y à donc exactement 7 transitions possi- 
bles. On convient que cette insertion dans une place donnée a une probabilité 
égale à 1/n. Autrement dit, les seuls états, atteints en une transition à partir 
de #, sont les états, notés fi(o) (1 < à < n), donnés par : 


fifa) = (01... ,0n) = 0; 
fofo) = (02,01:03,...,0n); 
fifa) = (o2,... oi, o1,0i1:...,0n); 


no) = (ax... 0n:01). 

L'ensemble des états étant l'ensemble Æ de toutes les n! permutations de 
(1,2,...,n), on forme la matrice P = (por) ((o,r) € E?), où por = l/n si 
T = fi(c) pour un certain 5 = 1,2,...,n et p,, = 0, autrement. On définit 
ainsi une chaîne de Markov ayant E pour ensemble d'états et P pour matrice 
de transition. 


Proposition 12.3.1. La matrice P est bistochastique. 
Démonstration. Soit o« une permutation; il y a exactement n transitions o + Tr 
de probabilité non-nulle; ce sont les n transitions a + fifa) (i=1,2,...,n), 
de probabilité 1/n. Chaque ligne de P {de longueur n!) contient ainsi exac- 
tement n coefficients non-nuls, tous égaux à 1/n 

Maintenant, soit 7 = (n1,...,7) une permutation. Introduisons, pour tout 
= 2,...,n, l'application inverse 


gr) = fr) = rar Tiane,Tn). 
Il y a exactement n transitions & + 7, de probabilité non-nulle; ce sont les 
transitions gi(r) + r (i = 1,2,...,n), de probabilité 1/n. Chaque colonne 
de P a donc exactement n coefficients non nuis, tous égaux à 1/n. [] 


Proposition 12.3.2, La chaîne est irréductible (deux états quelconques com- 
muniquent) et acyclique. 
Démonstration. Étant données deux permutations, on sait que l’on peut passer 


de l’une à l’autre par une suite de transpositions de deur éléments adjacents. 
Or, une telle transposition peut être engendrée par une suite de transitions. 
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En effet, soit o = (o1,...,@i,0iy1,...,0A) une permutation, que l’on récrit, 
pour simplifier, & = Ao;oi:1B. En posant toujours g = ft, on à go) = 
ciAois1B, d'où (fiya o g)(o) = fin(gi(o)} = Aois1o:B. Remarquons enfin 
que, si l’on applique À fois la transition f; à une permutation, on retrouve cette 
permutation ; autrement dit, {f;)! = Id, d'où gi = (fl et fi410( fi) lo) = 
A5i4+10:B. Le processus est bien irréductible. Enfin, puisque p,. = 1/n pour 
toute permutation #, le processus est acyclique. [| 


Proposition 12.3.3. La chaîne a une loi de probablité stationnaire u = 
(u1,... un) et une seule, donnée par w; = 1/n! pour tout i =1,...,nl 
Démonstration. Comme la matrice P est bistochastique et que le processus est 
irréductible et acyclique, on peut appliquer les conclusions du Théorème 6.7.1. 
Pour tout couple (o,r), on à pe — 1/nlet la loi uniforme sur les n! états 
est une loi de probabilité stationnaire. En particulier, la fréquence moyenne 
de séjour dans chaque état est 1/n! et le temps moyen de retour dans chaque 
étatestn! [] 


12.4 LE PROBLÈME DU SCRUTIN 


H s’agit du problème classique du scrutin, que l’on résoud traditionnellement 
à l’aide du principe de réflexion de Désiré André (cf. [FF1], chap. 4, 85) : 
dans un scrutin, on trouve a bulletins pour le candidat À et b bulletins pour 
le candidat B. On suppose a > b. Alors la probabilité pour que, durant tout le 
dépouillement, À soit toujours en tête est égale à (a —b}/(a + b). 

Dans ce paragraphe, on retrouve, certes, cette évaluation, mais, de façon 
plus essentielle, on calcule explicitement, à l’aide de la théorie des martingales, 
des probabilités liées au cheminement aléatoire dans le plan. 


Proposition 12.4.1. Soit (Y.) (n > 1) une suite de variables aléatoires 
indépendantes, identiquement distribuées, de loi commune ge_1 +pe41. Pour 
n > 1, on pose Sh := Yi +: +Ÿn et l’on désigne par N et c deux entiers 
supérieurs ou égaux à 2. Alors 

,Sv1 > 0| Sn = c} = i (12.41) 
P{Si<e..., Sn < el Sn = c} = À. (12.42) 


P{S1 > 0. 


Démonstration. Posons : Xo := Sx/N, X1:= Sw_1/(N — 1), ... , Xi = 
81/1. On sait (cf. Exercice 7.11) que cette suite est une martingale par rapport 
à (Ya). L'évènement À := {S1 > 0,...,Sxy-1 > O0} peut encore s'écrire 
{X1 > 0,...,Xw_1 > 0}. Si À n'est pas réalisé, soit & le premier indice 
tel quel<k<N-—-1let X, = 0. On a forcément 1 < k < N —2, car 
l'évènement {Xw-1 = 0} (= {Y1 = 0}) est impossible, puisque Ÿ1 ne prend 
que les valeurs —1 ou +1. On pose alors T := k et on définit T := N —1 si 
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l'évènement À est réalisé. La variable aléatoire T ainsi définie est un temps 
d’arrêt par rapport à la suite (Ya). 

Appliquons à la martingale X6,X1,...,Xw-1 le théorème d'arrêt pour 
le temps d'arrêt T'; écrivons, par conséquent, E[Xo] = EfXr}. Le premier 
membre de cette identité vaut E{Sy]/N. D'autre part, la variable aléatoire 
Xr prend la valeur 0 lorsque T = 1,...,N — 2 et la même valeur que 
Xn-1 = S1/1 = Yi, lorsque T = N — 1. Comme dans ce dernier cas, À est 
réalisé, la valeur prise est strictement positive et ne peut donc étre que 1. 
On a donc EfXr} = 1:P{T = N —1} = P(A) et par suite la relation 
P(4) = EjSnJ/N. Récrivons cette relation avec la mesure de probabilité 
P{|S» = c}. On obtient : P{A|Sx = c} = c/N, qui est l'identité (4.1). 

Pour obtenir (4.2), observons que, conditionnellement à l'évènement {Sn = 
c}, la loi de c — S4 est la même que celle de Sy — Sx, qui est la même que 
celle de Sy. Il en résulte : 


P{AI SN = c} = P{S: > 0... , Si > 0|Sv =c} 
=P{Si<e,...,Sn_1 <elSw=c}. 0 


Retrouvons la formule du scrutin telle qu’elle à été décrite au début de ce 
paragraphe. Pour ce faire, associons au n°°%° votant la variable aléatoire Y,, 
qui vaut 1 si le n°7 votant vote pour À et —1 s’il vote pour B. On suppose les 
YA indépendants et identiquement distribués. La quantité S, := Yi +-::+Y 
représente la différence de voix obtenues par À et B, après le vote du 
n°% votant. Avec N = a + b votants et c = a — b, la formule (4.1) fournit, 
conditionnellement à {Sn = a — b}, la probabilité que cette différence reste 
strictement positive durant tout le scrutin. On retrouve bien (a — b)/{a + b). 


12.5 LE PROBLÈME DU COLLECTIONNEUR 
ET DE SES FRÈRES 


Pierre achète des tablettes de chocolat d'une certaine marque; dans chaque 
tablette, il trouve une vignette qu’il colle dans un album édité à cet effet. 
L'album contient m emplacements, qui correspondent aux m différents types 
de vignette. On note T le nombre minimum de vignettes que Pierre doit 
acheter pour compléter son album. On suppose qu’à chaque achat, la proba- 
bilité d'obtenir une vignette donnée est 1/m. Pierre a r frères, numérotés de 1 
à r, qui eux aussi possèdent chacun un album analogue, mais qui n’achètent 
pas de tablettes. Si Pierre obtient une vignette dont il a déjà le type, il la 
donne au frère numéroté 1. Si ce dernier a déjà ce type de vignette dans son 
album, il la donne au frère numéroté 2 et ainsi de suite. À Pinstant T,, les 
frères 1,2,...,r ont respectivement NU), MU),... , N°) emplacements vides 
dans leurs albums. Il s’agit de trouver la valeur moyenne de ces nombres. 
Théorème 12.5.1. On a E[]] = mHa et EINO)] = Hu, où Hn est le 
ième : 
m nombre harmonique 1 + 3 +e+ n° 
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L'évaluation de E[T] est classique. Elle a fait l'objet de l’Exercice 2.6 et 
de l’Exercice 6.8. Rappelons que T est la somme de m variables aléatoires 
géométriques, indépendantes, de paramètres respectifs m/m, (m—1}/m,..., 
1/m. Par conséquent, T est presque sûrement finie. L'évaluation de E[NU)] a 
été imaginée par Pintacudal et résolue par la théorie des martingales. Nous 
reproduisons ici cette solution, qui nous a été transmise par G. Letta. 

Les types de vignettes sont numérotés de 1 à m. On note Yi, Ya, ... les 
types des vignettes que trouve le collectionneur dans ses achats successifs. Par 
convention, Yo = 0. On suppose donc que les Y, (n > 1) sont des variables 


aléatoires indépendantes, chacune uniformément répartie sur {1,2,...,m}. 
Pour chaque # = 0,1,..., on note x le nombre d’emplacements vides 


dans l'album du collectionneur à l'instant n, de sorte que x{0 = m, puis 
T = inf{n > 0: xp = 0} et enfin xp = 0. Pour k = 1,2,..., on note 
x® le nombre de vignettes qui sont apparues exactement k fois, jusqu’à la 


date n incluse. Alors Y x = m. De plus, le nombre N(*) d'emplacements 
#>1 


vides dans l’album du frère d'indice k > 1, à cet instant T, est égal à : 
NE = x (0 +. x, 


12.5.1 Le calcul par la méthode des martingales 
Supposons donnée une fonction f de N°? dans N satisfaisant, pour æ{0) > 1, 
l'identité 
20 (0 1,80 +1 — (a) 200) 
+et(f(e0, ee 1) — {a 200)) 20 (12.51) 

et formons le processus de terme général Z, := f a, x) {n > 0). Notons, 
enfin, W := ZIT le processus arrêté en T défini par : 

Wa := Zran = Zn linery + Zr nor. (12.5.2) 


Notons que le processus Z = (Z:) n’est pas une martingale. Il s'agit, en ef- 
fet, d’un processus borné, positif, qui tend 0 à l'infini, sans être identiquement 
nul. Or, si c'était une martingale, il serait identiquement nul. 


Lemme 12.5.2. Le processus W est une martingale par rapport à la suite (Y:) 
(r > 0). 


Démonstration. Désignons par AW,, ... les accroissements W,41 — WA, 
Ii s'agit de montrer que EJAW, | Yo,Ï1,..., Ya] = 0. Montrons d’abord 
AW = Aa lo 9 (12.53) 


En effet, AW, = Wa+1 — Wy = Zn+i Tintier} + ZT Hnu1>7y — Zn tn — 
27 Tiny = AZ L{nery+Zn#1(l{ntier} ner) +27 (nti27) Mn») = 


1 N. Pintacuda. — Coupon collectors via the martingales, Bol. Un. Mat. Ital., À 17, (1980), 
p. 174177. 
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An liner) = An Lx ® ap 
même que celui des Z;, tant que l'album de Pierre n’est pas terminé. 

Montrons ensuite que les trois évènements {A XA o = —1}, {AXà pe —1} 
et {A Xà OLA Xr o = 0} forment un système complet d'évènements. En effet, 
lorsque l’on passe du n° achat au (n+tjère, il n'y a que les trois possibilités 
suivantes : Pierre obtient une nouvelle vignette (l'évènement {ax =-1}se 
réalise), ou c’est le cadet qax® = —1} se réalise), ou enfin Pierre et le cadet 
ont déjà Ja vignette qui apparaît au (n + 1)" achat ({A xP = AXQ = 0} 
se réalise). 

Il en résulte 


An = Tax 


L’accroissement des variables W, est ainsi le 


AP 1,20 +1) CH x) 


+ are GP, XP 1) 740,40), 


On a, d'autre part, EU {ax 2 1 1%,...,Y]= XŸ /m pour i = 0,1. Prenons 
l'espérance conditionnelle de AZ,, en tenant compte de la Règle 4 du chap. 1; 


on obtient : 


() 
DEVAIS ARR AE (x 1x2 +1) 7x0, 30) 
4 
LP, x 1 — C0, xD). 
D'après (12.5.3), on en déduit : 
EAW, lo Ms. Vol = 260 07 EVA [Yo Ye, Ya 


une expression qui est nulle d’après Phypothèse (12.5.1) sur la fonction f. [ 


Appliquons alors le théorème (d'arrêt) 8.3.1, à la martingale W et au 
temps d'arrêt T, ce qui est licite, puisque la martingale W est évidemment 
bornée (elle ne prend qu'un nombre fini de valeurs) et que T est presque 
sûrement fini : E[Wr] = E[Wo]. Or, ElWr] = Ef/(XP, X0)) = Eif(0, xD) 
et E[Wo] = E{20] = Eff(X, XŸ))] = Eff(m,0)] = HU On a ainsi : 
E[f(0, xp ) = f(m,0). Pour obtenir la relation Ex ) = Han, il suffit de 
trouver une fonction f, qui, en plus de (12.5.1), satisfait les propriétés : 
f(O,at9) = x0) et f(m,0) = Hn. Pintacuda (op. cit.) a judicieusement 

0 


none D ao) (D) æ 
imaginé la fonction : ft ),æ D) = H,0 + Treo 


12.5.2 Le calcul par la méthode combinatoire 


La méthode de Pintacuda peut aussi être utilisée pour le calcul de E[N(*)] 
pour n'importe quel & > 1, mais a l’inconvénient, même pour k = 1, de ne 
fournir qu'une équation aux différences, dont il faut deviner la solution. Pour 
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le cas général, nous préférons recourir à une méthode combinatoire, qui à 
l'avantage de fournir la solution directe et même de donner l’expression des 
fonctions génératrices sous-jacentes. 
à : # zen: 
La suite des nombres hyperharmoniques Ki (k > 0, m > L) est définie par 
les relations 


K{9 := 0, pour tout k > 1; KQ := 1, pour tout m2>1; (12.54) 
et pour k& > Let m > 2 par 
KE 


) 
Ka an 


= K®.. (125.5) 


Comme tous les nombres Kk® valent 1, on voit que 1 + KP n’est autre que 
le m°% nombre harmonique H. La table des premiers nombres hyperhar- 
moniques est reproduite en fin de chapitre. 


En utilisant les séries génératrices, la récurrence (12.5.5) s'écrit sous la 
forme : 
Ge Da 
k>0 #>0 


Puisque Y KW = 1, on obtient : 
#20 


L 
LR = Done On) 


k20 


En décomposant la fraction rationnelle en éléments simples, on déduit, pour 
k>0Oet m > 2, la formule explicite 


(-m+ 2) 1 


{&) = _ ST 12.5. 
KŸ) = m{m — 1) à “I CEE (125.7) 
où (a)x désigne la factorielle montante : 
Lf$} sin=0; 
(an = a(att)(ata-1), sn>1 
Théorème 12.5.3. On a E[X0)] = 1+KÛ = Hn, puis E[X xûe = K@ pour 


k > 2, soit, par conséquent, E[N®] = 1 + re + KD +: +k$ ) pour tout 
k>1 


Soit (£,51,52,...) une suite de variables commutatives. Si f envoie un 
ensemble fini À dans un ensemble (fini) B d’entiers, on note v;(f} le nombre 
d'éléments j € B tels que l’image réciproque f—1(j) soit de cardinal à. Le 


poids n(f) de f est défini comme étant le monôme x({f) := sn, 
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: 2 dm a : : 
Développons la série ( =) en une série de puissances de #. On obtient : 
i>1 


DE D ( . Jus. Comme à > 1,... ; im > 1, le 
rem gpl Nm 

ht imen 
coefficient multinomial (, 


7 im) n’est autre que le nombre de surjections f de 


5 
[r] = {1,...,n} sur [m] = {1,...,m} telles que le cardinal de f-1(1) est à, 

, le cardinal de f ) est im. Si on note Surj([»], [m]) l’ensemble des 
surjections de {#] sur fm], on a donc l'identité : 


Esp" - De Er). (12.5.8) 


nèm  feSurj([n].[rml) 


Notons maintenant Afn,m) le sous-ensemble des surjections f appartenant 
à Surj({»], fm]) telles que si f(n) = j, alors j n'apparaît pas dans la suite 
(f(),..., f(n — 1)). Comme la restriction f le 1] de f à [n — 1] est elle- 


même une surjection de [n — 1] sur {m] \ {f{n}}, l'identité (12.5.8) implique 


Hi m1 gl 
ma(S 5) = Y = D (f}. (125.9) 
1 * n-12m-1 © SEA(nym) 
Soient alors r > 1, puis n := (n1,n0,...,n+) une suite d’entiers positifs et 


enfin A(n,m;n) le sous-ensemble des surjections f appartenant à A(n,m) 
telles que w(f) = mn: pour i=1,2,...,r 
En posant s; := 1 pour tous les entiers & > r + 1 et en notant #A(n,m;n) 
le cardinal de Afn,m;n), l'identité (12.5.9) se récrit : 
4 w ml 
man(e—1+ 48 —1)+ 82— Data) 
CE D #A(n,m;n) pr s. (12.5.10) 
ir 
Maintenant, l'évènement {T = n, X{) = rase, A = n,} se réalise si et 
seulement si l’application f : ir Ÿ; (1 < i < n} appartient à l’ensemble 
A(n,min). De là, 
A(n,m;n 
P{T=n XD 2m, Xÿ = n,) = LU 
La fonction génératrice du vecteur aléatoire (T, xfl }, en ,xf ) est donc 
donnée par 
SP{T = n,Xf) = Rise, XD = np }éteft sûr 


an 


= DE js L#AG m2) Il 2511) 


nom I<i<r 
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Or le membre de droite de (12.5.10) est une série normalisée par des factorielles 
nl et non par des puissances m". Il nous faut donc introduire l'opérateur {,,, 


qui envoie une série de la forme à = 3 an(s1,...,s-)t"/n! sur la série 
RS0 
Qma := Y anfs1....,sr){/m,. On vérifie, très facilement, que la série 
n>0 


transformée peut encore s’écrire : 
+00 
On 8 = m [ ET Gants... , T8) de. (12.5.12) 
0 


Appliquons l’opérateur (,, à l'identité (12.5.10) et multiplions ensuite les deux 
membres par &/m; on obtient 


ê w m-1 
FRa(A(E Et DE ge D ét ee D )) 


= Eye L#Atumn) Il SF 


nEm 1Sigr 
soit, en tenant compte de (12.5.11) et (12.5.12), 
(2519) DP{T=n, XP = nn, AU) = njJhtant sfr 


nn 


æ at 
= ma {et 
mort f € (e 1+— ml 


(a—1)+: +7, 1)" de. 


On obtient ainsi, sous la forme d’une intégrale, la fonction génératrice du 


vecteur aléatoire (T, X7 OX …, XF ) Cependant, en développant la fonction à 
intégrer au moyen du théorème multinomial, on peut calculer explicitement 
cette intégrale; on trouve : 


Lie Skck 
3 Eva )- D TLC se ro 


De cette expression, on retrouve la fonction génératrice usuelle de T et donc 
immédiatement son espérance É[7] = m Hh. Le plus important est qu’une fois 


obtenues les fonctions génératrices des variables x ) (4 > 1), on puisse, grâce 
à la formule explicite (12.5.7), sommer leurs dérivées en 1, et ainsi déterminer 
leurs espérances. En effet, on déduit : 


n —1 m{s — 1 
PET =njt=s X (ae D Ed 


n>l a+b+e=m—1 
et pour k>2 


Lretenee fr) ere to) 


n>1 a+b-+e=m—1 
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D'où, par dérivation, 


+2 1 
EXP ]= -È Ce + m1) De UE u +2 


=1+ ra = Hs 
le résultat déjà prouvé dans le précédent paragraphe. De plus, pour # > 2, 


+2} 1 
bo  (b+2)itE 


Table des nombres byperharmoniques : : 


E[x{} = mm 1) Dr ns Ÿ (me +2) m = = KD,. 


m _|1 2 3 4 5 10 15 20 25 30 35 40 45 59 
KL OT OA OU OU HO 1 OU OA OU 1 1 1 
K® 0 0,50 0,83 1,08 1,28 1,93 2,31 2,60 2,82 3,00 3,15 3,28 3,39 3,50 
K® 0 0,25 0,58 0,80 1,06 2,14 2,98 3,67 4,27 4,79 5,26 5,68 6,07 6,43 
ko 0 0,13 0,30 0,50 0,71 1,79 2,82 3,76 4,64 5,46 6,23 6,96 7,65 8,30 
K® |0 0,06 0,16 0,29 0,43 1,27 2,20 3,14 4,08 4,99 5,89 6,77 7,63 8,47 
KE 0 0,03 0,09 0,16 0,24 0,81 1,51 2,28 3,08 3,91 4,75 5,59 6,44 7,29 
Po) 0 0,02 0,04 0,08 0,13 0,48 0,95 1,49 2,09 2,73 3,40 4,09 4,80 5,52 


Par exemple, avec m = 50, l’aibum du collectionneur se termine, en 
moyenne, après 225 achats. Il y a alors, toujours en moyenne, seulement 4 
ou 5 places vides dans l'album du premier frère, 11 places vides dans celui du 
second frère, 19 dans Palbum du troisième frère, etc. 


Chapitre 13 


Le mouvement brownien 


Ce dernier chapitre est consacré à l'étude du mouvement brownien. Il n’était 
pas question de faire une théorie exhaustive. On n'y trouvera que les propriétés 
essentielles et un exposé sur les temps d'atteinte. On s’est efforcé de faire un 
parallèle avec les processus à temps discret, lorsque ceci était possible. 


13.1 LE MOUVEMENT BROWNIEN COMME LIMITE D'UNE 
PROMENADE ALÉATOIRE 


Considérons une particule qui se déplace sur Z, en pratiquant une promenade 
aléatoire symétrique : dans chaque unité de temps, elle se déplace d’une unité 
de longueur vers la droite ou vers la gauche avec probabilité L On est donc 
en présence de la chaîne de Markov, homogène sur Z, définie par la matrice 
de transition P = (m5) (à, € 2), où pis = à, Pis1 = à pour tout i € Zet 
où tous les autres coefficients sont nuls (cf. $ 5.2.5). 

Supposons maintenant que la promenade soit accélérée en prenant des sauts 
de plus en plus petits, dans des intervalles de temps de plus en plus petits. 
YŸ a-t-il un processus limite, obtenu en faisant tendre vers 0 la longueur des 
sauts et l’intervalle de temps? 

De façon précise, supposons que, dans chaque intervalle de temps, de 
longueur At, la particule se déplace d’une longueur Az vers la droite ou vers 
la gauche avec probabilité à et notons X(t) sa position à la date t > 0 en 
faisant l'hypothèse X(0) = 0. On a alors 


X()= Ar(Xi++ Xhyar), (13.11) 
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où 
+1, sile 27% saut de longueur Az s'effectue vers la droite; 
X,= \ gu 


—1, sile 7% saut de longueur Az s’effectue vers la gauche. 


En supposant les variables aléatoires X; indépendantes, de même loi, cette loi 
commune étant la loi de Bernoulli }(£_1 +41), on a E[X;] = Oet Var Xi = 1 
pour tout i. De (13.1.1), il résulte alors : 


E[X(t)}=0,  VarX(t) = (Ar)?[t/A]. (13.1.2) 


Il s’agit maintenant de passer à la limite, de sorte que le processus limite 
ne soit pas trivial. Si, par exemple, on prend Ax = At et on fait tendre At 
vers 0, on obtient E[X(#)] = 0 et Var X(t) — 0. Le processus X (f) serait alors 
presque sûrement nul. 

Prenons Az = VAf et At — 0. Alors E[X({#)] = 6 et Var X(é) — t. On 
obtient un processus limite (X{t)} (t > 0} admettant les propriétés suivantes : 


Propriété 13.1.1. Pour t > OD fixé, la variable aléatoire X(t) suit la loi 
normale N(0, VE). 
Démonstration. En cffet, d’après (13.1.1), la variable X(£) réduite s'écrit : 
At(Xs ++ Xy/A4) : Ait. + Xgyan L X1+:.:+ Xpyai 
VE VijAt Xi ++ Xpyag) 


D'après le théorème (central limit» (cf. [FF1]; chap. 1, £11), cette quantité 
tend en loi, vers une variable aléatoire de loi N(0,1). [] 


Propriété 13.1.2. Le processus {X{t) : t > O0} est à accroissements 
indépendants, ce qui veut dire que pout toute suite 0 < ti <-.- <t (n > 2), 
les variables aléatoires X(t1), X(t) — X(ti), ... , Xin) — X(tn_1) sont 
indépendantes. 


Démonstration. Cet énoncé résulte du fait que, dans la promenade aléatoire, les 
sauts ayant lieu dans des intervalles de temps disjoints sont indépendants. [] 


Propriété 13.1.3. Le processus {X(t) : t > 0} est à accroissements station 
naires, ce qui signifie que la distribution de la variable X(t+ s) — X(t) ne 
dépend pas de t. 

Démonstration, Cette propriété résulte du fait que, dans la promenade aléa- 


toire, le changement de position dans un intervalle de temps ne dépend que 
de la longueur de cet intervalle de temps. [] 


Cette introduction heuristique permet de donner la définition du mouve- 
ment brownien, comme développé dans le prochain paragraphe. 
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13.2 DÉFINITIONS ET PREMIÈRES PROPRIÉTÉS 


Définition 13.2.1. Un processus stochastique {X(+) : t > 0} est appelé mouve- 
ment brounien (standard) si les trois conditions suivantes sont satisfaites : 

(1) X(0) = 0; 

(2) {X(#) :# > D} est à accroissements indépendants et stationnaires; 

(3) pour tout t > 0, la variable aléatoire X{t) suit la loi normale N(0, 4) 
(de moyenne nulle et d'écart-type V7). 


Remarque 1. Ce processus est également appelé processus de Wiener (1918) ; 
il a été étudié antérieurement par le botaniste Robert Brown (1827), puis par 
Einstein (1905). 


Remarque 2. Si pour tout t > 0, la variable X(£) suit la loi normale N(0, cV#) 
(c > 0}, on parle encore de mouvement brownien; si c = 1, on dit que c’est 
le mouvement brownien standard. Tout mouvement brownien {X(t) : & > 0} 
peut être ramené au mouvement brownien standard en considérant X(t)/c; 
nous supposerons donc toujours c = 1. 


Propriété 13.2.1. Avec une probabilité égale à un, X(t) est une fonction 
continue de t ; autrement dit, presque toute trajectoire du mouvement brounien 
est continue. 


Nous ne démontrons pas cette propriété, mais nous observons ce qui suit. 
(a) La fonction aléatoire X(t) est localement continue en probabilité. 
En effet, si À > 0, on a, pour tout € > 0 


Var(X(t+h)= X(0) _ Var X(h) À 
€? ei 


PUXG+R)— X()1>e}< 
une expression qui tend vers 0 lorsque À tend vers 0. {] 


{b) La fonction aléatoire X{t) n’est dérivable en aucun point t ER. 


En effet, pour À > O0, la variable aléatoire Y — XC+R) 2 X() 


est normale, 
de moyenne nulle et de variance 1/h. Par conséquent, pour tout N > 0, 
P{Y}> N}=P{X(G+R)-X(t)> Nh} 
X() 
= P{JX (4) > Nh = {F2 > nv) 
{IX(R) } VA , 
d'où, puisque X(h)/V/h est de loi N(0,1), 


1 2 
P{Y| > N}= = Pa 
Ur > M} 7 lon # 


une expression qui tend vers 1 lorsque À tend vers 0; d’où le résultat, N étant 
arbitraire. [ 
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Propriété 13.2.2 (Loi temporelle du mouvement brownien). Soit 0 < #1 < 
ta < ++. < fn < +oo. La loi du vecteur (X(t:1), X(t2),..., X(t:)) est une loi 


normale à n dimensions, dont la densité conjointe f(x1,%2,...,æn) est donnée 
par 
f(rute,... tn) 
1 


(27)/2 ht — Hi)" — én 1) 


1 (mm) (ün — Tn-1)? 
x exp(—s (+ Pr RS ler meer )) (13:21) 


Démonstration. La densité du vecteur (X{t},X(t2),..., X(4n)} au point 
(t1,T9,...,%n) est la même que celle de (X (41), X(t2) — X(t1),..., X(tn) — 
X(tn-1)) au point {æ1,r2 —21,...,%n —Zn_1). Or, ce dernier vecteur a toutes 
ses composantes indépendantes, puisque le processus est à accroissements 
indépendants et toutes normales, de moyenne nulle. Enfin, puisque le pro- 
cessus est à accroissements stationnaires, les variances de ces composantes 
sont 1, fa — É1, ... » fn — dn-1, respectivement. [] 


Propriété 13.2.3. Le vecteur (X(t1), X(t2),..., X(fn)) est centré et sa ma- 
trice des variances-covariances est donnée par : 


oh oh à 
hi to to A 
D=lt te ta te 
1 do 3 4. fn 


Démonstration. Il est clair que le vecteur est centré On peut retrouver 
l'expression de la matrice des variances-covariances là partir de la la densité 
donnée dans la Propriété 13.2.2, mais il est plus intéressant de procéder comme 
suit. . 
Si V est un vecteur-colonne, notons {V le vecteur-ligne transposé de V. 
Soient alors M’ le vecteur-ligne 


Ph, M) ie (Ah), X (to) — X(b),..., X(fn) — X(én-1)) 


et {M le vecteur-ligne {X(h), X(t2),..., X(fa)), de sorte que le vecteur- 
colonne M est égal au produit matriciel À M”, où À est la matrice triangulaire 
inférieure qui a des 1 sur et au-dessous de la diagonale et des zéros au-dessus. 
Comme le vecteur M’ suit une loi normale à n dimensions #/(0,[”), où la 
matrice des variances-covariances [” est la matrice-diagonale diag(ti, to — 
É,... tn — tn1), le vecteur AJ suit la loi normale W(0,T), avec T = AI'tA 
{cf., par exemple, [FF1], Théorème 5.6, p. 153). 

On peut naturellement calculer T à l’aide de cette dernière formule, mais 
il est plus instructif d'opérer directement. Pour 1 < i < j < n,on a: 
Cov(X (4), X(4)) = ELX(E)X (4) = EUX (4) (A) + Vin ++ V)]. Comme 
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X(t) est indépendant de (Yi41 +++. + Y;) et que E[X(4;)] = 0, on en déduit 
Cov(X(t:), X(t5)) = E[X(Hi)?] = #; et donc 
Cov(X(t), X())=EX(H)X(t)=h (1<i<j<n} (132.2) 
soit aussi 
Cov(X(s), X(#)) = min(s,t). [] (13.23) 


13.3 TEMPS D'ATTEINTE, VARIABLES ALÉATOIRES 
MAXIMALES 

La propriété que les trajectoires du mouvement brownien sont presque 

sûrement continues, jointe au principe de réflerion (cf. [FF1], chap. 4, 85) 

permet de calculer très simplement des probabilités intéressantes associées au 

mouvement brownien. 


13.3.1 Temps d'atteinte 


Pour & > 0, désignons par 7, le premier instant où le mouvement brownien 
atteint a (cf. Figure 13.1), soit 


=infft>0:X(t)=a}. (13.3.1) 
Admettons que ce temps d’atteinte est presque sûrement fini, de sorte que 
Von peut considérer des variables de la forme X(T, + t} avec t > 0. 


X() 


>t 


FIGURE 13.1 


Définissons le processus {Y(t) : > 0} comme étant égal à {X(t) :# > 0} 
jusqu’à la date T, et égal, après cet instant, au symétrique du processus 
{X(®) : € > 0} par rapport à la droite d’ordonnée a : 

YÉ = X(E), st<T; 
2X (Ts) — X(t)=2a-X(t), st>T. 
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Proposition 13.3.1 (Principe de réflexion). Les processus {X(t) : t > 0} et 
{Y(E) :t > 0} ont même loi. 

Démonstration. Pour t < Ta, on a X(t) = Y({t), par définition. Pour des 
valeurs supérieures ou égales à Ti, c’est-à-dire pour 7, +t avec t > 0, écrivons 
Y(Ti+t) = 20-X(Ta+t) = a+(a-X(Ti+t}}. On fait apparaître le processus 
{a- X(Ta+t) :t > 0}, qui a même loi que le processus {X(T,+t)—a : t > 0}. 
Or, ce dernier est le processus qui redémarre en 0 à l'instant 7. Il est intuitif 
que c’est encore un mouvement brownien et qu’il est indépendant du passé 
jusqu’à la date Te, tout comme son symétrique {a — X{T, ++) :t > 0}. 

Pour démontrer ces deux propriétés rigoureusement, il faudrait introduire 
une notion de propriété de Markov forte pour le mouvement brownien, 
analogue à celle qui avait été formulée pour les chaînes de Markov au 
paragraphe 5.5. En admettant ces deux propriétés, on voit donc que Y (Te + 
t}= a+ (a X(T, +t)} est indépendant du passé jusqu’à la date T, et a 
même loi quea+(X(T+t)—-a)= X(T+t). [] 


La fonction de répartition de T, se calcule en considérant P{X{+t) > x} 
pour + > a et en conditionnant par rapport à l'évènement {T, < #} et son 
contraire. Pour r >a,ona: 


PLX() > 2} = PLX(E 2 & | Ta < E}P{Ta 8} 
+P{X() > ra >t} PR > t}. 
Si {Ta < t} est réalisé, alors le processus atteint a, pour la première fois, 


en un point de l'intervalle [0,4] (cf Fig. 13.1). Avec les notations de la 
Proposition 13.3.1, on a donc 


P{X(E) > {Ta St} = P{Y(E) S2a-x|T St} 
= P{X(E) < 2a — | <t} 


et par conséquent P{X(t) > a|T <t} = F2 
Si {Ts > t} est réalisé, alors il est clair que P{X(+) > aÏT, >t}= 0, car, 
par continuité, le processus ne peut prendre une valeur supérieure ou égale 
à x sans avoir, au préalable, atteint a. On a donc finalement : P{X(t) > a} = 

EP{Ta St}; d'où 
P{T, <t}=2P{X() > a} 
2 fre 20 2 [= pe 

= = e dr = —— evR dy. (13.3.2 
Î V2r Jaf Vi ÿ ( ) 


Remarque 1. Comme, pour a < 0, la loi de T, est la même que celle de T_, 
on en tire, pour a quelconque, 


2 ft a 
PR <O= EE | UE dy. 
test} VA havi° ? 
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Remarque 2. La densité de Ti, pour a > 0, s'obtient par dérivation : 
= -%_-8/2,-0?/(%) 
t) = t e > 0). 13.33 
fr ( ) 2x { ) ( ) 


13.3.2 Variables aléatoires maximales 
Pour a > 0, on a, par continuité, 
P{sup X(s) > a} = P{T <t}, 
ogs<t 


c'est-à-dire, d’après (13/3.2), 


+0 , 
P{ sup X(s) > a} = el dy. 
O<s<t 


2 
V2r La 


13.3.3 Récurrence 


Dans la relation précédente, en gardant a > 0, faisons tendre t vers +oo. On 
obtient : 
P{supX(s) > a} = P{Ta < +00} = 1. 
s>0 


La dernière égalité montre que le processus {X(t) : & > 0} est récurrent. 


13.4 LE PONT BROWNIEN 


Définition 13.4.1, Soit {X(t) : t > 0} un mouvement brownien standard. Le 
processus {Y(t) : 0 < t < 1}, où Y{+) := X{t) —- 4 X(1) est appelé pont 
brownien. La fonction t ++ E[Y(+t)] (0 < & < 1) et la fonction (s,f) + 
Cov(Y{s),Y(t)} (0 < s < t) sont appelées fonction d'espérance et fonction 
des variances-covariances. 


Presque toute trajectoire de ce pont est une courbe continue sur [0,1] 
passant par les points (0,0) et (1,0). 


Propriété 13.4.1. Les fonctions d'espérance et des variances-covariances du 
pont brownien sont données par : 

(a) EF(H]=0 (@<t<1); 

(b) Cov{(Y(s), Y(t)) = s(1—t) (0<s<t<1) 
Démonstration. La première identité est triviale; pour prouver la seconde, on 
fait usage de l'identité (13.2.3) : Cov(Y{(s), Y(t)) = Sovtx(s) —sX(1), X(#)— 
iX(1)) = EX (s)X(t)] — sE[X() au )}] — tE[X(s)X(1)] + stE[X2(1)] = 
s—st-ts+st=s-st= s(l-t). 


La loi du pont brownien, qui vient d’être défini et que l’on peut appeler 
pont brownien, par excellence, admet une interprétation au moyen du condi- 
tionnement {X(1) = 0}, comme décrit dans le théorème suivant. On y utilise 
les notations suivantes : 
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{X() :t > 0} est un mouvement brownien standard; 

D<ti<to <:.<tn <1(n > 1) est une suite de nombres; 

le vecteur-ligne (X(t1), X(é),.…, X(t:)) est noté tX ; on pose, de plus, 

bye ue) (Xb) 4 X (1), X tn) — te X(L)): 

Ze (Z1,..., Zn) = (hi X(1),... ,én X (4); de sorte que l’on a l'identité : 
X=Y+Z. 

Comme décrit dans le paragraphe 1.13, la loi du vecteur X conditionnelle à 
{X(1) = 0} est définie comme l'espérance conditionnelle E[f{xe8y | X(1) = 0]. 
On peut aussi calculer la probabilité conditionnelle P{X € B||X(1)| < 1/k} 
et faire tendre ensuite &k vers l'infini (cf. Exercice 13.9). 


Théorème 13.4.2. La loi du vecteur Y est égale à la loi, conditionnelle à 
{X(1) = 0}, du vecteur X. 
Démonstration. Les vecteurs Ÿ et Z suivent évidemment des lois normales 
à n dimensions. Ils sont, en outre, indépendants; pour le vérifier, il suf- 
fit de montrer que E[Y‘7Z] = 0 ou que, pour 1 < i,j < n, on a: 
E[(X (#4) — t:X(1)} tX()] = 0; ce qui est vrai, puisque cette quantité vaut 
t EX (6) X(1)) — tit, EÛX°(1)] = tt — dit; = 0. 

Par ailleurs, l'évènement {X(1} = 0} est réalisé si et seulement si {Z = 0} 
est réalisé. En appliquant la formule (1.13.8), pour toute suite de boréliens 
B1,...,Bh, on obtient : 


P{Â {XD € BIXQ) = 0} + PLÂ {M + 2) € 812 = 0} 


n 
=PÔBMeEBI O 
= 
La proposition suivante est donc aussi démontrée. 


Proposition 13.4,3. Soient {X(t) : t > O0} ur mouvement brownien stan- 
dard et 0 < fi < ++: < tn < 1 une suite de nombres. Alors la loi de 
(X{H),...,X(tx)), conditionnelle à {X(1) = 0} suit la loi normale N(0, 1"), 


s h(l-h) h(l-t) h(1-—ts) h(1— tn) 
h(l—te) tofl-t2) tal ts) ta(1— tn) 

LI'= hi(1-—t3) tt —t3) ta(l—t3) t(l—tn) 
HA) BU) hÜLh) ee ht) 


En particulier, pour D<s<1, la loi de X{s) conditionnelle à {X(1) = 0} est 
la loi normale N(G, /s{1 — s)). 


13.5 QUELQUES MODIFICATIONS DU MOUVEMENT 
BROWNIEN 


Les modifications introduites dans ce paragraphe sont toutes des processus de 
Markov dont les trajectoires sont presque siurement continues. 
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13.5.1 Le mouvement brownien réfléchi 


Définition 135,1. Soit {X(t) : t > D} un mouvement brownien. Le processus 
{Y@) : 42 0}, où Y(t) := [X (4) (t > 0}, est appelé mouvement brounien 
réfléchi (à l’origine). 

Proposition 13.5.1. On a : E[Y(t)] = 25/7 et Var Y(t) = (1 —2/n)t. 
Démonstration. D'abord, 


1 2 + l 2 
EW( =[ 1-00 4 =2/[ 12/09 Gr, 
POIs plie r=2} van x 
d’où le résultat en faisant le changement de variables 2?/(2t) := u. Ensuite, 
Var (9 = EN2(0)] - (EY (0) 
2t 2 
= EX] - EYE +5) D 


T 


T 
13.5.2 Le mouvement brownien absorbé 
X() 
z 
Q T L 


FIGURE 13,2 


Définition 13.5.2. Dans la définition du mouvement brownien donné dans le 
paragraphe 2, remplaçons la condition (1) X(0} = O par (1°) X(0}) = x > 0. 
On obtient le mouvement brownien commencé en x. Désignons par T le 
premier instant où ce mouvement brownien atteint la valeur 0 et introduisons 
le processus {Z(t) : t > 0} défini par 
_JXt@), sit<T, 

OP: sit>T. 
Ce processus est appelé mouvement brownien absorbé (à l’origine) (cf. Fi- 
gure 13.2). 


13.5.3 Le mouvement brownien à dérive {« drift ») 
Définition 13,5.3. Soient {X(t) : + > 0} un mouvement brownien et # un 


nombre réel. Le processus {Y (+) : & > 0}, où Y(t) := X(t) + ut, est appelé 
mouvement brownien à dérive; la constante pu est le paramètre de dérive. 
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Si u # 0, le processus n’est plus symétrique et le principe de réflexion ne 
s'applique plus pour le calcul de la loi du maximum. On à alors recours à la 
théorie des martingales (ef. $ 13.6}. 


Proposition 13.5.2. Le mouvement brownien avec dérive a les propriétés 
suivantes : 

(a) Y(0)=0; 

(b) le processus est à accroissements indépendants et est stationnaire ; 

(a) pour tout t > 0, la variable aléatoire Y(t) suit la loi normale de 
paramètre {ut, V). 


13.5.4 Le processus d'Ornstein-Uhlenbeck 


Définition 13.5.4. Soient {X(t) : t > 0} un mouvement brownien et à un 
nombre strictement positif. Le processus {Y(é) : # > O}, où Y(t) := 
e”(et)/2% (et), est appelé processus d'Ornstein-Uhlenbeck. Il à été proposé 
pour décrire la vitesse d’une particule immergée dans un fluide. 
Proposition 13.5.3. Pour tout t > 0, on a E[Y(t)] = 0 et pour D < s <t< 
+00 on a : Cov(Y(s), Y(+)) = e-at-s)/2, 
Démonstration, La première relation est évidente. Ensuite, 
Cov(Y(s), Y{t)) = EY(s)Y (O1 = 72e 2 E[X (68) X (e9t)] 
= ete? 0t/2,as = eratt-s)/2 O 


13.5.5 Le mouvement brownien géométrique 


Définition 13.5.5. Soit {X{t} : t > 0} un mouvement brownien. Le processus 
{F (6) : 4 > 0}, où Y(é) = eX(), est appelé mouvement brounien géométrique. 

On l’étudie surtout lorsque le mouvement brownien sous-jacent est à dérive, 
ou même s'il est de la forme X{t) = uë(t) + pt, où {E(t) : t > 0} est le 
mouvemnt brownien standard. Dans la proposition suivante, on suppose cette 
dernière condition satisfaite. 


Proposition 13.5.4, Soient {£(t) : t > 0} le mouvement brownien standard et 
{Y (8 24 > 0 le processus géométrique défini par : V(E) := et) Hit, Alors 
EfY (+) = eturu?/2) eg Var Y(t) = eXtutu?/2 (et? —1). 

Démonstration. En effet, E[Y(t)] = eftEfeté@)] = ego (a), où gety(u) 
est la fonction génératrice des moments de E(t), qui vaut e" #/2, Ensuite, 
E[Y2(+)] = Efelutteto)] = Ou (Qu) = etat Gu)tf2 2 Au) D'où 
Var Y( =E[r 26] (ET) = etetu/2(eu 1). 
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13.6 MOUVEMENT BROWNIEN ET MARTINGALES 


La théorie des martingales à temps continu n’a pas été développée dans cet 
ouvrage. Nous allons nous contenter de donner les définitions et de décrire les 
analogies avec les résultats établis dans les chapitres 7-11 pour les martingales 
à temps discret. 

Soit {X(t) : £ > 0} un processus défini sur un espace probabilisé (N,%,P); 
soit, d'autre part, (%:) (4 > 0) une famille de sous-tribus de la tribu 4, qui 
est croissante, en ce sens que l’on a la propriété : 


Vs,t, O<s<t—% CC. 


{1) Le processus {X (+) : t > 0} est dit adapté à la famille (94) (t > O), si, 
pour tout £ > 0, la variable X(#) est %;-mesurable; ce qui signifie que l’image 
réciproque (X(#))-*(B) de tout borélien B est un élément de la tribu 2. 

(2) Une variable aléatoire T définie sur ((,%,P), à valeurs dans {0, +oo], 
est appelé temps d'arrêt relativement à la famille (24) (£ > 0), si, pour tout 
+ > 0, l'évènement {T < +} appartient à 9. 

(3) Le processus {X(#) : t > 0} est dit être une martingale par rapport à la 
famille (24) (t > 0), si 

(a) pour tout t > 0, on a : E[{X(#)|] < +00; 
{b) pour 0 < s <t,ona:E[X(#) |A] = X(s). 


Cette condition (b)} utilise la notion d'espérance conditionnelle E[X(t) |2L,] 
de X({t}) par rapport à la tribu A. Ceci veut dire que E[ X(t)|2.] est une 
variable aléatoire {.-mesurable et qui est telle que pour tout À € %, on a 
l'identité : E[FaX(#)] = E[ZAE( X (6) |24}}. 

Par conséquent, la condition (b} s'exprime encore en disant que pour tout 
A € %,, la relation E[Z4X(t)] = E[Z4aX(s)] est satisfaite (en particulier, 
EfX(t)] = E[X(s)]). Cette relation est à rapprocher de la condition (b), 
Définition 7.1.2, pour les martingales (X,) à temps discret, qui s'exprimait 
par E[ZaXa] = Efl4aXn+1] pour tout À appartenant à la tribu engendrée par 
le vecteur (Ya, Y1,...,Y2), une tribu qui joue le rôle de 4,. Notons encore que 
la condition (b) implique que la martingale {X(t) : £ > 0} est adaptée à la 
famille (44) (t > 0). 


Théorème 13.6.1. Le mouvement brownien standard {X{(t}) : t > 0} est une 
martingale par rapport à la famille (A+) (t > 0), où Xe est la tribu engendrée 
par les variables X, (0 < s<t). 


Démonstration. Soit 0 < 8 < t < +oo. Alors E[X (4) |A] = E[X(s) + (X(t) — 
X(s))1A] = EIX(s) 1e) + EIX(t) — X(s)12]. Or, E[X(s) |A] = X(s), 
en appliquant l’analogue de la Règle 2, 61.13. Puis, E[X(£) — X(s) 14] = 
E{X(t) — X(s)] en appliquant l’analogue de la Règle 1, 81.13, puisque X{t) — 
X(s) est indépendante de la tribu M,, le processus étant à accroissements 
indépendants. Enfin, E[X (+) — X(s}] = 0, puisque les variables X(s) et X(t) 
ont même espérance mathématique. D'où l'identité E[X(?) |. = X(s). © 
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Les inégalités maximales pour les martingales à temps discret ont été 
démontrées dans le chapitre 10. Nous donnons, sans démonstration, leur 
énoncé pour les martingales à temps continu. Le Théorème 13.6.1 permet 
alors d’utiliser ces inégalités pour le mouvement brownien standard. 


Inégalités maximales. 


Ve>0 P{ sup IX (8)! > €} < AO, (13.61) 
Es <t 
Ve>0 P{sup, IX(s)} 2 €} < 2x1 = _. (13.6.2) 


Théorème 13.6.2. Le processus U(t) = X?(t) — + est une martingale par 
rapport à la famille (4) (t > 0), où 2% est la tribu T((X,) (0 < s <t)) 
engendrée par la famille des variables aléatoires (X,) (0 < 8 < t}. 
Démonstration, Soient 0 < s < # < +00. Alors E[U(+) [A] = E[X?(4) |A] — 
t. Or, E[X°()]%) = E[(X(s) + (X() — X(s))° 1%) = EfX?(s) 12%] + 
2EIX(s)(X (6) —X(s)) |A] +EICX(E) — X(8))° 1%] = X°(8) +2 À (5) ELX (6) — 
X(s) 12]+E(X (6) -X (8) 12%] = X7(s)+2X (5) EIX (4) — X(s)]+ EI(X(E) — 
X(s))?] = X2(s)+4— 5 et par conséquent E[U(4) [A] = X?(s)+ (4-3) —4— 
X?(s)-s=U(s). [ 

La martingale de Wald associée à une suite de variables aléatoires, 
indépendantes, identiquement distribuées, admettant une fonction génératrice 
des moments à été construite au paragraphe 7.3. Le théorème suivant montre 
que l’on peut construire une martingale analogue, qui est, elle, associée au 
mouvement brownien. Par analogie avec le cas discret, on introduit le proces- 
sus {V(#) : t > 0}, où 

ex® ex) ut 
V(t):= EG) = AE = exp{u(x(t) _- 5) 


Théorème 13.6.3. Le processus {V(t)} : t > 0}, est une martingale par rapport 
à la famille (As) (4 > 0), où 4 := T((XS) (0 < 8 <t)). 


Démonstration. Soient 0 < 8 < t < +oo. Alors 
E(V(#) IA] = e7°t/2 Efes*X PA = er #42 Efe"(X (CL) (8) 14] 
= ert2t/2 QuX(s) Efetx (x (8) 124] 
= e-vt/2 QuX(s) EAU -X(6)] = e-vt/2 QuX(8) QuÂ(t-e)/2 
= e-%e/2 QuX(s) V(s). O 


Remarque. Pour le mouvement brownien, de dérive 4 et de coefficient de 
n D p 4 A D | — 2. 
diffusion o?, la martingale associée est définie par : eX(#)-ut mot/2, 
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Application. La martingale {V(t) : £ > 0}, définie dans le Théorème 13.63, 
est à valeurs positives. En utilisant l'inégalité maximale (13.6.1) et en notant 
que l’on a E[V(t)] = 1, on obtient : 


Cette dernière inégalité permet de déduire des inégalités maximales pour le 
mouvement brownien à dérive. En effet, pour « > 0, on a identité entre les 
évènements : 


{se (x) _ 5e) > v} et {ue V{s)> ew}, 


Comme P{sup V{s)> e} <e7"%, on en tire, pour w,v > 0, l’inégalité 
LS 


P{sup (x) — —) > v} <er", 


st 


Cette inégalité, relative au processus à dérive {X(#)—ut/2 : t > 0}, est utilisée 
dans les problèmes de ruine. 


13.7 TEMPS D'ATTEINTE 


Considérons un mouvement brownien {X({t) : t > O}, où X{t) est une 
variable aléatoire normale d'espérance xt et d’écart-type o1/#. On suppose, 
de plus, X(0) = 0. La fonction génératrice des moments est donnée par 


ga) = EX) = uutetf2 (4 > Qu € R). Pour a,b > 0, on définit 
le temps d'atteinte T par : 


Ti=inf{t>0:X(t) = a où X(t) = +b}. 
Propriété 13.7,1. Le temps d'atteinte T est un temps d'arrêt adapté à 
{X(®) :t2> 0}. 
Propriété 13.7.2. On a : P{T < +oo} =1. 
Démonstration. En effet, pour tout t > 0 fini, on a les majorations : 


a+b 
oVont 


+b 

P{T = too} € PIT > t} = P{-a < X(t) <b}= [ fxç(e) de < 
—a 

D'où P{T = +00} = 0, en faisant tendre t vers l'infini. [| 


Ci-après, on utilise l’analogue continu du théorème d’arrêt pour les mar- 
tingales dominées, à savoir le Théorème 8.3.1. Les hypothèses sont : (a) 
P{T < +00} = 1 (c’est le contenu de la Propriété 13.7.2); (b} le proces 
sus arrêté {X(T At) : t > O} est borné (ce qui est banal ici). Lorsque le 
processus {X (4) : ? > 0} est une martingale (c’est le cas lorsque y = 0, voir 
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ci-dessous), on peut conclure que E[X(T)] = E[X{0)]. On utilise aussi les no- 
tations ra := P{X(T) = —a} et rs := P{X(T) = b}, de sorte que, d’après la 
Propriété 13.7.2, on a: ra+re =. 


13.7.1 Cas symétrique a = 0 


Dans ce cas, le mouvement brownien {X(t) : & > O} est une martingale, 
d’après le Théorème 13.6.1. On peut alors appliquer le théorème d'arrêt et 
écrire : E[X(T)] = E[X(0)j. Comme la loi de X(T°) est la loi de Bernoulli 
Faë-a +(1— ra), on en déduit 0 = E[X{0)] = E[X(T)] = ra(—a)+(1-ra)b, 
d'où b 


= (13.7.1) 


Ta 


une expression qui est indépendante de o?. 


13.7.2 Cas non-symétrique y 0 

Dans ce cas, le processus {X(t) : t > 0} n’est plus une martingale. On lui 
associe alors la martingale de Wald {Z(+) : t > O}, définie, pour tout u £ O, 
par 


eux(t) ua? 
Z(j= —— = X(E) —ut(u + 2). 
De Ty = e(ux (0 -u(u+ )) 
Choisissons u = —2u/a? de sorte que l'on ait y: + uo?/2 = 0 et considèrons 


ainsi la martingale 


Z{4)= exp(—2x (6) (> 0). 


2 
La variable Z(T) = exp (5x (T)} ne dépend alors de T que par l’intermé- 
diaire de X(T}. On est dans les conditions d'applications du théorème d'arrêt : 
E[Z(T)] = E[Z(0)] = 1. Par conséquent, ra e-24(-0)/o? (127) 24b/e7) 2 1, 
soit 
1e 2nb/ot 1 — e2nb/o? 
Tetaler ele 1 eroH)r 


(18.7.2) 


Ta 


Remarque. Lorsque 1/0? tend vers 0, on a ra —+ b/(a+b), l'expression trouvée 
dans le cas symétrique. Ceci est, en particulier, le cas si o? est fixe et js tend 
vers 0, ou bien, lorsque y est fixe et o? tend vers +00. 


13.7.3 Mouvement brownien débutant en y 


Pour y réel et £ > Q, considérons le mouvement brownien débutant en y défini 
par 8%(t) := y + X{(t). Posons TY := inf{t > 0 : SY(+) = c} et pour c < y < d 
évaluons la probabilité P{TY < TŸ} pour que le processus, partant de y, 
atteigne c avant d. 
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Étant donné e < y < d, posons a := y—cet b:= dy. Les formules (13.7.1) 
et (13.7.2) donnent : 
d= y 
d—c? 
1 ever 
Treo SH. 


siu=0; 


P{TY < TY} = (13.7.3) 


Pour calculer P{TŸ < TY}, il suffit de faire les substitutions y — —y et 
d—y+y-e. On obtient alors : 


Yy—cC 
dc 
den er 
Ten SA 


siu=0; 


P{TY < T9} = (13.74) 


Dans les deux cas 4 = 0 et y # 0, on constate que l’on a : 
P{IY < T}} + P{IŸ < TE} = 1. 


Considérons l'évènement «le processus {SY(£) : £ > 0} atteint c au moins 
une fois», un évènement qui s'exprime encore par {TŸ < +co}. Pour tout y 
réel, la famille des variables aléatoires (TŸ) (d > y) est croissante et tend vers 
Vinfini lorsque d tend vers l'infini. Il en résulte que la famille des évènements 
{TE < TŸ} (d > y) est croissante, lorsque d tend vers l'infini et sa limite est 
{TY < +00}. On a donc : P{TY < +oo} = lim P{TY < TŸ}. En vertu de 
(13.7.3), on en déduit : d+ce 


1, si u= 0; 
P£TY < +00} = 4 eue c 1, si > 0; (3.7.5) 
i, si y < 0. 


De même, P{TŸ < +oo} = lim P{TŸ < T#} et de (7.4) on tire : 
d eco d < 


4, siu=0; 
P{TY < +00} = 4 1, su >0; (13.7.6) 
e lue 1, si u < 0. 


Ce résultat montre que le mouvement brownien symétrique (H = 0) est 
récurrent, alors que celui avec dérive non-nulle (y 3 0) est transient. 


13.8 LOI DE PROBABILITÉ DU TEMPS D'ATTEINTE 


Soit {X(i) : > 0} un mouvement brownien tel que X{t) soit d'espérance pt 
et de variance #?t avec o > 6. Dans le paragraphe 13.3.1, ont été données, 
en (13.3.2) et (13.3.3), la fonction de répartition et la densité du temps 
d'atteinte T, := T9 en un point x, pour un mouvement brownien standard, 
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c'est-à-dire tel que u = 0 et « = 1, débutant en 0. Lorsque y est toujours nulle 
et que © n’est plus nécessairement égal à 1, ces formules deviennent : 


2 ft à 
P{TL <t =] dy (t> 0): 13.8.1 
Bst- ose y (t>0) ( ) 
Pre = Er 97 ete &@>0). (138.2) 

FT 


On déduit de (13.8.1} que, pour x # 0, on a : in P{T > #} = 0 
+00 
et A P{T9 > t} = 1. Par conséquent, TŸ est presque sûrement fini et 
appartient à l'intervalle 10, +00, presque sûrement. 
Proposition 13.8.1. Si y = 0, o £ 0 etx #0, on a : E[T®] = +00. 
Démonstration. Dans l'intervalle [0, +oo], on a 
+60 
ET‘ = [ P{T9 > éd, 
0 
soit, en posant a := 2/27, B = 
+00 BIVE 
E[T°] = af àt | e 12 qu 
(] (] 


+00 Bu? 
=af e A du f dt 
(] (] 


+ 1 
na 8 - = 
«8 | u° “Pur +0. ! 


æl/o; 


Considérons maintenant le cas avec dérive 4 non nulle. Dans les formules 
(13.7.5) et (13.7.6), prenons c < y = 0 < d. On obtient P{TŸ < +00} < 1, 
si # > 0 et done si pre < 0. De même, P{TŸ < +00} < 1, si y < 0 et donc si 
ud < 0. On obtient également P{TŸ < +00} = 1, si y < 0 et donc ge > 0, 
puis P{TS < +00} = 1, si y > 0 et donc pd > 0. On peut donc récrire : 

si px < 0, alors P{TŸ < +oo} < 1; 

si ux > 0, alors P{TS < +00} = 1. 

Pour le calcul de la loi de probabilité de TŸ, nous faisons appel de nouveau à 
la martingale de Wald (cf. 813.7.2)! 


Z(t)= exp{uxX(#) _- ut(u + )). 


Prenons x > G et distinguons les cas y > 0 et ps < 0. 

(a) 4 > 0; pour u > 0 et 0 < t < T®, on à 0 < Z{t) < exp(ux). Le pro- 
cessus arrêté (en T£) est donc borné. Comme P{TŸ < +00} = 1, on peut ap- 
pliquer l’analogue continu du théorème d’arrêt pour les martingales dominées 


1 Nous remercions M. Émery de nous avoir explicité cette méthode de calcul. 
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{cf. Théorème 8.3.1) et écrire : 
1 =EfZ(0)] = EIZ(TS)] = Elexp{ur - uT(u + ))]. 
En prenant pour w la solution positive u = (4/7 + 250? — u)/0? de l'équation 
uu + wo?/2 = 8, on trouve, pour tout s > 0, l'identité 
Efe-#7] = e-(Vi2807-n)(e/0?), (138.3) 
On obtient ainsi la éransformée de Laplace de la loi de TŸ. La transformée 


de Laplace inverse du membre de droite de (13.8.3) peut être obtenue (voir 
Exercice 8). On obtient, pour TŸ, la densité de probabilité : 


LL 2, 37 lyz 2 
fro(t) = Ko! en(-r (5 — avi) ) {t > 0). (13.8.4) 
Posant f(s) := Et), on trouve directement l’espérance mathématique 


de T?, à savoir E[TŸ] = —f/{(0) = x/p. 
(b) # < 0; pour tout u > —2u/o? et 0 < t < TŸ, on a : 0 < Z(t) < exp(ux). 
D'autre part, comme Z(o0) = 0, on en déduit : 
2 
u 
1=EfZ(T9) = Efexp(ur — ua (u + 7) Lrg cc]: 
Pour tout s > 0, on trouve la transformée de Laplace 
El Loco = e (VA are), {138.8.5) 
En particulier, pour s = 0, on obtient l'évaluation : 
P{TÉ < +00} = e#/, 


une expression strictement inférieure à 1, puisque 4 < 0. 


13.9 COMPLÉMENTS ET EXERCICES 


13.1 Soit {X(+t) : t > 0} un mouvement brownien standard. 

{a) Pour 0 < s < t, on a Cov(X{(s), X(t)) = s, soit, de façon générale, 
Cov(X(s8}, X(t}) = min(s,t). 

(b) Pour 0 < s < t la loi de X{s), conditionnellement à {X(+) = b}, est la 
loi normale N{u,a) avec u = bs/t et o = Vs{l — 8/t). 

(c) Pour 0 < s <t <1,on a: Cov((X(s), X(t))| X(1) = 0} = (1 -t). 
[Utiliser la formule (1.13.4}, avec Z + X(1), g + Id, X + X(s)X(t), 
Y + X{t) et (b).] 


13.2 Pour a > 0, calculer P{ inf X(s) < 0! X(0) = a}. 
O<s<t 
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13.3 Soient 0 < to < t; et a € R. Si X(to) = a, la probabilité P(a) pour que 
X(t) admette au moins un zéro dans [o, t:1] est donnée par : 


Jal tite 


Var ho 


P(a) y #/26-2/Cu) qu, 


13.4 Soient O0 < to < ti; la probabilité à pour que, si X(0) = O, la fonction 
X(t) admette au moins un zéro dans [to, #1] est égale à : 


2 t 
a= = Arccos/=. 
T ti 


[Soit B l'évènement «X({) admet au moins un zéro dans [#0,41]. Calculer 
P(B) par la formule (cf. formule (1.13.3)) 


P(B) = | PEB IX (Ho) = a} fixta(a de, 


où fixty(@) est la densité de |X (to)! et utiliser l’Exercice 13.3.] 


13.5 Deux mouvements browniens indépendants {X(t) : t > 0} et {X2(4) : 
t > 0}, tels que Xi(t) est d'espérance zut et de variance oèt (à = 1,2), se 
trouvent à la date t = 0 dans les états 21 et ze (1 < 22), respectivement. 
Caiculer la probabilité pour que ces deux processus ne se rencontrent jamais. 
[Distinguer les cas 41 — po = 0, > 0 et < 0] 


13.6 Soit {X(t) : t > 0} un mouvement brownien tel que X(0) = O0 et 

tel que X(t} soit d'espérance ut et de variance a?t avec o > 0. On pose 

Y:= — inf X(#) et Z := sup X(t). Si x > 0 (resp. si u < 0), alors Y (resp. Z) 
2 0 


est une variable aléatoire exponentielle. 


13.7 Soient n et p deux entiers tels que n > 2, 1 < p < n—1 et 
tX := (X1,...,Xh) un vecteur aléatoire suivant une loi normale (0,7), 
avec © régulière. On pose : *Y := (X1,...,X,) et 7 := (Xpy1,..., Xn). 
On peut ainsi partitionner la matrice T' des variances-covariances comme 
Dulce Da te EfV Vi, Don te E(2 2), Ta = ‘Ta := EY 2]. 
Toi Too 
On se propose de déterminer la loi de Ÿ conditionnelle à {Z = z}, où z est 
un certain élément de R°"?. 

(a) On pose : Y’:=Y - AZ, Z':= Z, où À est une matrice (p x (n—p)). 
Déterminer À pour que les vecteurs Y’ et Z” soient non corrélés. On trouve : 
A=TaTz. 


I = 
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{b) Cette matrice À étant fixée, les vecteurs Y” et Z’ sont indépendants et 
Y' suit une loi normale W(0,["} avec L' += Pis — Pia Dog Ton. 

{c) Le vecteur Y = Ta Tai Z + Ÿ' est la somme de deux vecteurs 
indépendants. La loi de Y, conditionnellement à {Z = z}, est la loi normale 
Nil x, l”). [Appliquer la formule (1.13.8). 


15.8 Pour t > 0, on pose 


I(8) = [” exp(-5(u _ 2) du; (a) 


(a) On a les évaluations : 1(4) = V@9r/2; J(+) = (V2r/2) et. 
@) Pour s>0etz>0,ona: 
+ LT ,-3/2 ,-2?/(4t) ju ave 
Î e EN É e dt=e . 
{Faire le changement de variables t = x°?/(2u?) et utiliser (a)] 

(c) La transformée de Laplace de la fonction f(t} est définie par £ f(t) := 
JP er FE dt := g(s). On écrit f(#) = L'!g(s) pour ia transformée de 
Laplace inverse. Les relations suivantes sont immédiates : 

Llag(s) = a L g(s) = af(t); 

Li gs — a) = et LÀ gs) = ef(#); 

Lo g(s/a) = a (at). 

On déduit de ces relations et de (b) que l’on a : 


L'le-(Vr+2se-y)(x/o?) fre {#), 
où fro(t) est donnée par (13.8.4). 


13.9 On reprend toutes les notations du Théorème 13.4.2 et on utilise le fait 
que les vecteurs Ÿ et Z sont indépendants, comme démontré au début de la 
démonstration de ce théorème. Considérons une suite de ñ couples de nombres 
réels (a1,b1}, ... , (an, bn), tels que a1 < b1, ... , an < bn. Pour k assez grand, 
on obtient l'encadrement 


P{Mlu+1/k<Y<b-1/H}< PL <V+Z<} 
i=1 i=1 


CDI < 1/#} 


nñ 
< P{ A {ai —1/R<Y <bi+1/k}}, 
= 
d'où l’on tire 


PE A {a <K<h} = P{Â {ei < X(t) be} 


Æ(11= 0}. 


Solutions des Exercices 


CHAPITRE 2 


2.4 A l'aide des variable aléatoires Y;, l'évènement {T4 = n} s'exprime 
comme {Yo # À,...,Yn1 € AY € A}, qui appartient évidemment à 
E(Yas..., Yh). De même, l'évènement {TY” = n} se réalise si et seulement 
s'il existe un ensemble 7 d’entiers positifs, de cardinal r, tel que max] = n et 
tel que pour touti=0,1,...,nonait Ye A,siielet V6 A,siiglI. Un 
tel évènement est aussi dans T(ŸY0,..., Yu). 


2.2 Le dernier instant où le processus est dans À peut s'exprimer comme 

Th := sup{n > 0 : Yh, € A}. Or, {T4 — n} n’est autre que l'évènement 

{M € AN N {4 £ A}. Dans le cas des variables aléatoires indépendantes 
k>n+t 


considérées, {T4 = 1} = {Zo = -1,Z, = 0,Z2 = 1}. Si cet évènement 
appartenait à &(Z0, Z1) = T(Y6, Y1), il devrait être réunion d'évènements de 
la forme {Zo = io, Z1 = à}, avec üo, à = +1. On devrait donc avoir p < p? ou 
p < pg, d’où une contradiction si l’on suppose 0 < p < 1. 


2.3 Pour chaque n > Oona{Ta=n}) = {Y=0,...,Ynn1 = 0, = 
1}, ce qui redémontre que T4 est un temps d’arrêt. De plus la probabilité de 
l'évènement est égale à g"p. Supposons r > 2 et reprenons les mêmes notations 
que dans la solution de l’Exercice 2.2. Le nombre de sous-ensembles J d’entiers 
qui conviennent est égal à (,7,) et la probabilité de M1" = 1}N [art = 


0} vaut p'g"+1—7, d'où P{TŸ) = n} = (,)prantir, 
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2.4 L'évènement {T = n} ne se produit que si n — 2 ou 8. On a {T = 
2} = {Yo = 1} € Soi Ve) et {T = 3} = {Vo = 0} € E(o Vi Yo. Ya). De 
là, Test un temps d'arrêt. 

De même, {T” = n} est l'évènement impossible si n # 2,3 et {T' = 2} = 
{3 = 1} € (M, Yi, Yo, Y3). D'autre part, l'évènement {Y3 = 1} n’appartient 
pas à T(Yo, Y1, 2). 


2.5 Notons que T ne prend que des valeurs paires. D'abord, {T = 
2k, Var < 1} = {T = 2k}; ensuite, pour 0 <i<k-—1,ona: 

{T = i,Y < 1} = {T = D, Zrpi + + Zreai-0 < 0} et de même, 
{T = 2k,Y > 1} = {T = 2h); pus, pour Ÿ 2 4 < k- 1, on à : 
{T = ,Yx > 1} = {T = 2, Fra ++ Zrsag-n 2 0}. D'après 
le Théorème 42, PÊT = 2, Zrai ++ Zoe à < = = P{T = 9i} 
P{Zrn + + Zruo < 0} = P{T = H}P{Z +: + Zum < 
0}, une expression encore égale à P{T = 2}P{Z: +... + Zen > 0}, 
puisque l’on a supposé p = qg = L Pour 0 < i < k on en déduit : 
P{T = 2i,Yy < 1} = P{T = 2i,Yax > 1} et en sommant sur à, P{T 
2,Ym < 1} = P{T < 2k,Yy > 1}. On en tire : P{T < 94} 
PIT < 2k,Y < 1} + P{T < 28, > 1} P{T < 2k,Yx = 1} 
2P{T < 9%k,Yax > 1} — PÎT € 28, = 1} = 2P{T < 2k,Yx > 1}+ 
PT < 2k,Yæ = 1} = 2P{Yx > 1} + P{Yax = 1}, puisque chacun des 
évènements {Yx > 1}, {Ya = 1} entraîne la réalisation de {T = 2k}. 
Puisque p = q = ?, on peut encore écrire : P{T < 2k} = P{Yx > 1} 
+ PU < —1}P{Yx = 1} = 1 — P{Yæ = —1}. Cette dernière probabilité 
s’évalue par un simple comptage : GD)2- 2k, Par conséquent, P{T < 2k} = 


2 
-@ 1) 9%. 


IA 


2.6 (a) On suppose les vignettes numérotées de 1 à m; pour chaque n > 1, 
on désigne par Y, le numéro de la vignette obtenue au n°?" achat. Les Y, 
sont supposées mutuellement indépendantes et chacune uniformément répartie 
sur {1,2,...,m}. Les variables aléatoires U1, Ua, ... , Un sont à valeurs 
dans {1,2,...}. Pour toute suite (u1 = l,u2,...,un) d'entiers, l'évènement 
{WU = wi, Ua = u9,..., Um = um} est réalisé si et seulement s’il existe une 
permutation (j1, 32, .. , jm) de (1,2,...,m) (les numéros des vignettes quand 
elles apparaissent pour la première fois) telle que soit réalisée la conjonction 
des évènements : {V1 = ÿ1, Vo = j1,..., Vu, = Ji: ut = fo}, 
{Vuotore ee Vustus € 4132} Vaotuet1 = 8} 

Vartus+2re ee Yustugtau € 172 J8h Yustuatue1 © Ha} 2 

Pagtetume #2 ee Vagtetrim EÂD1 + mt Vuo+e ntm On en tire : 


P{U = 0, Vo = U2,... Um = Um} 
L'ONCIONORCO RE" 
ONCE OR) 
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(b) Si on somme l'identité ci-dessus par rapport à tous les u; (i 
2,...,m) sauf l'un d'eux, disons & (2 < & < m), on trouve : P{Ux = we} 
k—1l\u-1 —k+1 
(—)" (+) (ur = 1,2,...); ce qui montre que U4 suit une loi 
géométrique de paramètre p = (m—k+1)/m et que les Ux sont mutuellement 


indépendantes. 


(c) La fonction génératrice d'une variable géométrique de paramètre 
est ps(1 — gs)”!. La fonction génératrice de UK est donc : 
Gur(s) = 
OT = Tn = (Im — Tai) + (Ti — Tina) + + (D =D) + = 
Ui + Uo +: + Un. La fonction génératrice de T est donc 


Gr= se I] a)". 


1<kEm 
L’espérance d’une variable géométrique de paramètre p est 1/p, d’où 


1 1 
ne D aps mets) 


1<k<m 


M 


On retiendra que T est la somme de m variables aléatoires géométriques 
indépendantes, de paramètres respectifs m/m, (m — 1}/m, ... , 1/m. La 
variable T est donc presque sûrement finie. 

Autre variante : on peut calculer directement la fonction génératrice de T'à 
partir de la fonction génératrice des nombres de Stirling de seconde espèce. 
L'évènement {V1 = %1,..., Ya = fn} est contenu dans {T = n} si et seulement 
si l'application k += j4 (k = 1,2,...,n — 1) est une surjection de l'intervalle 
[,n — 1} sur l'ensemble [l,m]) \ {jx}. D'où P{T = n} = (m—1)!S(n - 
1,m—1}m/m, où S(n,k) désigne le nombre de Stirling de seconde espèce. ! 
Or, (cf. op. cit.) E Sfn—-im-1)s®% = I] (1-ks) 1 D'où l’on 

1<k<m-1 


tire : Gr(s) = E Fr n}st= ml(s/m)" E S(n—1,m—1)(s/m}" 
=ml(és/ne ui CT (k—1)s/m). 


2.7 (a) Conditionnellement à l'évènement {Y1 = 0} (resp. à l'évènement 
{Y = 1,Y = 1}, resp. à l’évènement {V1 = 1,Y = O}), la loi de N 
est celle de 1 + N (resp. la loi de la constante 2, resp. la loi de 2 + N). 
D'où EÏNIY = 0 = 1+E[N], puis EN[Y = 1,Y% = 1] = 2, 
enfin EIN|M = 1,Y = 0] = 2+ EfN]. Comme {M = 0}, {Y = 
1,Y% = 1} et {Yi = 1,Ÿ2 = 0} forment un système complet d'évènements, 
on à : EN] = EN|M = OJP{ = 0} +EN|M = 1,Y = 1] 


1 Comtet (Louis). — Analyse Combinatoire, vol. 2, p. 42. — Paris, Presses Universitaires 
de France, 1970. 
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P{M = 1, =1}+EN |" = 1, = 0]P{M =1,Y = 0} = (1 +E[N])S + 
2}+(2+E[N])}, soit E[N] = 6 enfants et donc 3 garçons en moyenne. 

(b) Conditionnellement à l'évènement {Y1 —= 1}, la loi de N est 
celle de 1 + N. Conditionnellement à {Y1 = 0}, la loi de N est la loi 
de 1+ Z, où Z est une variable aléatoire géométrique de paramètre È : 
P{Z = k} = (1/2)4/2)-1 = (1/2)6 pour & = 1,2,... D'où E[Z] = 
2 et E[N] = EWIYM = 1iP{YM = 1} + EN[Y = OP{Y = 0} 
= (1+E[N))E + (1 + E[Z]) à, soit E[N] = 4 enfants et donc 2 garçons en 
moyenne. 

On peut également évaluer la fonction génératrice G(s) de N dans les deux 
exemples. Posons u, := P{N = n}. Dans le cas (a), u1 = 0, u2 = } et 
Un = Fun-1 + Luna pour n > 3. Onen tire : G(s) = Ls2+ 3 G{s) +st &(s), 
d'où G(s}= 282(1— 25 Es2)1 et EIN] = G{1) = 6. Dans le cas (b), 1 = 0 
et Un = uni + @" pour n > 2. D'où G(s) = ksG(s) + (4s)?(1 — gs)! et, 
par conséquent, G{s) = (4s)?(1 — Às)-?, puis E[N] = G’(1) = 4. 

2.8 (a) Le processus (X,) (n > 0) prend ses valeurs dans E = {—1,0,+1} 
et T est le premier instant où il entre dans À := {-1,+1}. C'est un temps 
d’atteinte, donc un temps d’arrêt adapté au processus (X,) (n > 0). Pour 
chaque n > 0, on a P{X, € A} = 2pq. Pour tout k > G, on en déduit 
P{T = k} = {Xo = 0,...,Xp1 = 0, Xx € A} = (1 — 2pq)f 2pq. Donc T suit 
la loi géométrique de paramètre 2pq et E[T] = 1/(2pa). 

{b} La variable Xr prend ses valeurs dans A. Puisque T est presque 
sûrement finie, P{Xr =1}= X P{Xr=1IT=K}P{T=Rk}= D P{Xr= 

Ë #Z1 


>1 > 
1iT = K}P{T = k}. Pour tout & > 1,on a: P{X, = 1[T = k} = 
P{Xx = 1[X1 = 0,...,X41 = 0,Xx € A}. Comme X1, ... , X3 sont 


indépendantes, cette dernière probabilité vaut : P{Xx = 1[X, € A} = 

P{Xr = 1,Xr € A}/P{Xs € A} = P{X4 = 1}/P{Xx € A} = pq/(2pa) = À. 

D'où P{Xr = 1} = D P{T = k} = EP{T < +oo} = À. De même, on 
k>1 


montre que P{T = -1} = L La loi de Xr est donc her +) 


CHAPITRE 3 


3.1 Pour0<s<t,ona:P{T €e[0,s]|N(t)=1}=P{T €[0,s}, N(t)= 
1}/P{N() = 1} = P{un top dans {0,s], 0 top dans |s,t}}/P{N(t) = 1} = 
P{un top dans [0,s]}P{0 top dans ]s,t]}/P{N(#) = 1} = e7XShsert-s)) 
(e MAY) = s/t. 


3.2 Le premier greffon arrive après un temps de T1 unités, le second 
après T1 + T2. Soit X1 (resp. X2) la durée de vie du premier (resp. du 
second patient). Les variables aléatoires Ti, T2, X1, X2 sont indépendantes, 
exponentielles, les deux premières de paramètre À, les deux dernières de 
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paramètre y1 et 4, respectivement. La probabilité que le premier patient 
soit greffé est égale à P{X1 > T1} = À/(À + ju), d'après un calcul qui a été 
fait dans {FF1], Exemple 2, chap. 12, $4. On peut aussi évaluer l'intégrable 
double ffocrer mie M Xe À dx dt. 
Le second patient est greffé si la réunion des deux évènements suivants est 
réalisée : {X1 < Ti < Xo}+ {Ti < X1,T1 + T2 < Xo}. Or, P{X1 < 
TD < Xo} = Iosserey 1e M8 Je À t pe 2 dx dt dy, une intégrale qui 
vaut Àp/(X + Ha)(X + 4 + po). Puis, P{T, < XiTi + D < Xo} = 

Ifoctemtitieey NE Alpne mt Xe Àte joe HA dés dx dta dy, une intégrale qui 
vaut (A/(À + p1 + po)) + (A/(X + u2}}. (Intégrer d’abord par rapport à x et 
ày) 
3.3 (a) En effet, X(t) = PIBDEU CE bi Si. 

(b) Conditionnellement à {N(t) = n} le vecteur (S1:...,5n) à même 


loi que l’échantillon ordonné (U},...,Ux%) de n variables aléatoires U1,... Un, 
indépendantes, identiquement distribuées, de loi uniforme sur [0,t]. Donc 


ES SIN(E) = nr] = Lex SIN) = r] = Lex Us = EU] = nt/2. 
D'où ES: Si] = = ELA SIN(E) = nl x PEN(E =n}= 

(7/2) D: A P{N(E = n}= = (4/2) EIN(#)] = À 82/2. 

Soit, nf, E[X(#)] = EIN (#)] — ES] = \#/2. 

34 On peut écrire E{A(t) NO = n] = ef) Ar eat) | NE) = 


5 


> ELA] Elfe X) | NG) = n] = nEfAÏE[e 2-2], en faisant appel 


la Proposition 3.5.3, la variable X étant uniformément répartie sur [0,4]. 
r, AS 2] = AO fe rate) de = (1— e-%#)/at, D'où 

A(t)|N(t) = n] = nE[A] (1 — e2t)/at et donc 

AIN] = NOEJAÏ( = e#)/at et EjA(] = EELA()IN()] = 
OR —e"%t}/at = XEjA] (1 — e7et)/a. 

Supposons 0 < 8 < t. Alors E[N(s} N(1= = EIN(s) N(s)+(N(t) - 
= E[N(s)?] + E[N(s8)(N(t) — N(s))], d’où, puisque le processus est à 
accroissements indépendants, 

Ne) N(t)} = E[N(s)?] + E[N(s)]E[(N(t) — N(s))]. On en tire 

ov(N(s); Me = E[N(s) N(t)} — EN (s)] EN (#)] 

ELN (a) + EN (SCENE) — N(s)1— ELN (D) = EIN(s)1 — (ELN (81)? = 
ar N(s) = 8. En général, Cov(N(s), N(t)}= À min(s,t). 

6 Pour tout { > Q et tout h > 0, on a : E[(N(E + À) — N(t)}?] = 
N(h}?} = Var N(h) +E[N(h)? = Àh+(Xh)? = Xh+o(h), une quantité qui 
tend vers 0 lorsque } tend vers 0. 


ze SRE 


a“ 


EH © 
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N k)— N( 
3.7 Pour > 0, h > Otelsqueeh < Leona: P{ME+D NE 2 


P{N(E+HR) - Nft) > eh} = P{N(R) > chi < P{N(R) > h = Àh+o(h), 
Nt+h)- NO) = s 

hk 
ENG) = = HU + (AR)*), une quantité qui tend vers Pinfini lorsque À 


nd vers Ü. 


su tend vers 0, pe k tend vers 0. En revanche, E|( 


3.8 Conditionnellement à l'évènement {T = #} (t > 0), la variable aléa- 
toire Z suit la loi de Poisson, de paramètre Àt. Pour tout n > 0, on obtient 
donc: P{Z = n} = ff °P{Z = n[T = t}f(#) di, où f(t) désigne la densité 
de T, soit pe Is D'où P{Z = n} = fe M((X)"/nl) ue ht dt = 
ant) JF et) gt, d'où, par le changement de variables (À+u}t := u, 
l'intégration : P{Z = n} = (un!) fi et (u/(à + ge) (L/(X + )) du = 
O/(QA + n)}"(u/(X+ 4). La variable aléatoire Z suit donc la loi géométrique, 
à valeurs dans {0,1,...}, de paramètre p = yw/(A + y). En particulier, 
P{Z>1}=1-n/(à+n)= NO +). 

3.9 En vertu de l'indépendance de Xo et du processus, on a : E[X(#)] = 
ElXol E[(-1)"] = 0. Ensuite Cov(X(s), X(#)) = ELX(s)X(t)] = 

EUX (D O+ M0) 2 Ef(-1) NO -NE)] 2 Ef( 1) 0-9] 

= Ef(-1)V6-s)}, car le processus est à accroissements stationnaires. D'où 


Cou(X(s) X(D)= D (IR e NE M2 Dr e-At-S) 5: CES = 
e2Xt-s). É 2 | 


3.10 (a) Dans tout cet exercice, on est ramené à calculer des densités 
marginales à partir de la densité conjointe de l’échantillon ordonné. D'abord, 


nt frs A + 
Lxi(s) = a dæ1-- drs-1 x [. CLS EE [ dtn 
{e) Ta-2 LR] 


= ms 1 CPL 
XT-Di* (si 
Pour trouver la asité de t— X*, on effectue le changement de variable 
Ys = È— Le. 
(b} De même, on a : 


Tr LA] 
Îxs xs (ar, &s) = af" dæi:: [ d£r-1 X Î d%r+1 
ps ar 


(0 <zs <t). 


F2 
Te + + 
-[ dts-1 x | den | tn 
Bone 2 Æn—i 
=? a Germ), Ga)t 


XT-n Gr- D" Ga 
(0 <a <a, <t). 
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(c) Lorsque r = 0 ou s = n +1, la densité de U,. a été calculée en (a). 
Avec 1 <r <s<n, on part de la densité fx:,x:(#,,4), calculée en (b) et 
on effectue le changement de variables : u := 2, — x, v := *,. On obtient 


n Lyr- aol (h un), 
r—l,l;s—-r—-}ln-s}é 


que l’on intègre de u=0àu—=t-u. Avec v:=(t-u)y,ona: 
tu 1 
[ du 0) do = (t— ur f YU — y) dy 
(] ( 


=ft-u) SH B(r,n— s+1) 
{r—1)t(n—s)! 
{n—s+r)l 

(cf. [FF1], chap. 14, 89). En reportant, on trouve la densité de U.... Noter que 
l'expression trouvée se spécialise en les formules obtenues en (a), lorsque r = 0 
ous=n+i 

(d) C'est la spécialisation de (c) pourr=lets=n. 

(e) C'est la spécialisation de (c) pour s = r +1. Il est remarquable que 
cette densité ne dépend pas de r. 


= (eayr 


NG)+1 
3.11 (a) Par définition-même, Q(t)= 2 Jm>1 est une variable qui a 
N(E) k=2 
même loi que 3 Z{r,>1, puisque les T; sont identiquement distribuées. 
#=1 


(b) On a : E[Q()] = E ED les>niNE = RJPIN® = n} = 
Z E"Ë Ir>g NO = 7] P{N(® =n}= E ES Hurss>} PN(E) = n} 


n2>1l 
ZE D P{Uran > I} P{N() = n} = £ n(1/2)(E — 1e (x) nl = 


En k=1 


At De PA Gé 1}le-At-D /{n — 1) DE - Dex 


(c) Cotte formule n'a d'intérêt que si 0 < ? < +. On obtient : 


Eole {or Si 


CHAPITRE 4 


4.1 (a) Soit N(f) le nombre de véhicules passant dans l'intervalle [0,4]. On 
suppose que {N(t) : & > 0} est un processus de Poisson de densité À, qui 
est l'espérance mathématique du nombre de passages par unité de temps, 
disons la minute, soit À = 6. Le nombre de camions passant au point 
fixé dans un intervalle de temps est un processus de Poisson de densité 
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Àp = 6 x 0,1 = 0,6. La probabilité qu’au moins un camion passe en une 
minute est : 1 —e”06 & 0,45. 

(b} Soit N(t) (resp. N,(#)) le processus de Poisson régissant le flot des 
camions (resp. des voitures). Il s’agit de calculer E[W(5) | N(5) = 10], qui 
vaut E[NC(5)|NC(5) = 10] + E[M(5)|N(5) = 10] = 10 + E[N,(5) = 
10 +6 x 0,9 x 5 = 37. 

(c) Conditionnellement à {N(10) = 30} les arrivées des trente véhicules 
se répartissent uniformément sur [0, 10], avec une proportion de camions égale 
à p = 1/10. Le nombre de camions suit alors une loi binomiale de paramètre 
n = 30, p = 1/10. La probabilité cherchée est de : (%)(1/10)%(9/10)27 & 0,24. 


4.2 On suppose que les instants d'arrivée des citoyens (resp. des étran- 
gers) sont régis par un processus de Poisson, de paramètre À (resp. 4). On 
suppose ces processus indépendants. Soit s® (resp. se) linstant d'arrivée 
ième citoyen (resp. du M étranger). Il s’agit de calcuier P{5 < sk}. 
Comme 5{? (resp. se) suit une loi gamma de paramètre (n, À) (resp. (me, u)) 
et que ces variables sont indépendantes, on a : 


+00 À L . +00 . _ 
p{sto < 5} = f m0" \E (Az) tar | a HU (ay) dy 


dun 


ES LS 
= Xe)" pe d 
Î m=1i e"F(Ax) > e gi de 


avec p := À/(À + y), 4 = 1-— p. On voit alors que P{5 < sy est la 
probabilité que, dans une suite indépendante de jets de (pile» ou «face», 
avec p comme probabilité d'obtenir «pile», on obtienne n «pile» avant m 
«face», en au plus (r +m — 1) jets. On peut évaluer cette probabilité par un 
autre comptage et on en déduit l'identité : 


S We pre L "x 1 (re Fprartmra 
k=0 ken 

On peut également arriver à la toute dernière formule, en utilisant l'argument 
de la seconde Remarque de la Proposition 4.2.1. On considère la somme { N(#) : 
& > 0} des processus {N((:) : # > 0} et {N((E) : & > 0}. La probabilité 
cherchée est la probabilité que lors de l’apparition des (n + m — 1) premiers 
tops, il y en ait au moins » qui proviennent du processus { N((+) : £ > 0}. 
L'identité précédente obtient ci-dessus une démonstration probabiliste. Elle 
peut, toutefois, se démontrer directement de la façon suivante. En util- 
isant la notation des factorielles montantes, le membre de gauche se récrit 
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1 mi : 
p AOL et le membre de droite p" > (7 Per = 
10 
1 


p* ec permet di — q)-1"l, Le coefficient de g° dans cette 
= 
k 
dernière somme vaut Sc} n-m+ikemtt+ Di Comme () = 


22 a D 
yo et (-m+l)g = (-m+1h(-m+1+iy, ce coefficient vaut 


encore 


Cm dk se hfn-m41h (ne de wtitisant l'identité de 
HC-m +1 k! 


Ch Vandemonde! cf chap. 1, 82). Le membre de droite est donc aussi égal 
m1 

ap D ((n)x/kljat. 
#=0 

43 Comme dans la démonstration du Théorème 4.4.1, on a : 


P{S( < a}= D PÉE a <a, NO=n}= D PLÈ Xe < 2, N(D= 
n>0 k=1 n>0 k=1 

LE PLÈ Xe <2}P{N( =n}= D P(z)e *(x0)"/n! 

n>0  k=1 n>0 


4.4 (a) En effet, l'évènement {Yni2m — m} est réalisé si et seulement si, 
parmi X1,X0,..., Xontm, il y à exactement (n + m) variables qui valent +1 
et n qui valent —1. Il y a aussi (7°) d'obtenir cette situation. 


(b) En utilisant le système complet {N(t) = n} (n > 0), on obtient : 


æ M 
P{S)=m}= PIS Xx=mN(t}=n}= 
n=û k=1 
DPEOUX = MN = n}j = PU, = mIPNE = n} = 
nd ki Le 
ext 2n4+m 
D P{omim = M}P{N(E) = 2n+m} = D (": M a ‘ 


(c) On a: LP =mN(t) =n}= et DE Tone) 


n>0 7 
DO" ae 2,2 PÉROMNET Lo ag pt 
x (paX+)" meTMer te Pie], 
Et (n+ mi DE ! 2 k! 
4.5 (a) Pour k > 0, on a : {Nift) = (W() = 2k} U {N(E) = 


2k + 1}. D'où P{Mi(t) = k} = MO er +e 


AH (2 + LI 
Le MC)/(2R)I)(E + A/(2k + 1). 
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(b) Si £ < a, on a P{No(t) = 0} = 3 et P{No(t) = k} = O0 pour 
k>1. Pourt>aet & > Oil vient : P{Né) = k} = P{N(-a)=k} = 
ee ((X( — a))*/#! 

(c) Soit X l'instant où s’est produit l’un des n tops et soit Ÿ la quantité 
aléatoire, de densité g(x), que l’on ajoute à cet X. Conditionnellement à 
{N() = n}, la variable Na(t) a même loi que la somme 
Luivieg ++ dix, +v, er, qui suit une loi binomiale de paramètres (n,p). 
1 s’agit d'évaluer p. Or, 


pe Eprarenl = PX+Y <= | Elliven 1X = l(1/07oute) de 

et Ell{x4ve|X = à] = L Ta+yei(y) g(v) dy, qui vaut G(t — x) = 

EE g(y) dy it > metOsit € x. D'où p= L Ge - 2)(1/#)au(e) de 
R: 


t 

a [ Gt - x) dx. On en déduit que P{Na(t) = k|N(t) = n} est nul si 
0 

n < ket vaut Cru — p}TTE si n > k. Par conséquent, 


ex)" Atp}fe-\? 
P{Ms(t) = k} = Z k PF = p} ON - Dre 


dans (lon aps CD 2 1st> ae CD) =0st< a. 


(4) lei Vs = (na + T)/2, d'où 
EfVaVag] = (1/4)ETo-1Ta + TorTne + TE + Talon] = (1/4)ETA + 
SEAT) = (1/2)((2/X5 + S(1/)T = BJ et ENV] = Eau = À 
Par ailleurs, Var V, = (1/4) (Var Th + Var Tn) = 1/(2X?). L’écart-type vaut 
ovs = 1/(AV3) et le coefficient de corrélation linéaire p(Vn, Va41) = (5/(42)— 
1/X)/U/@X) = 1/2, De plus, p(Vas Vos) = 0. Enfin, P{Va < 4} = 
P{Ti + Ta < 22} = JE (X/T(2))e (}u) du. 


4.6 (a) Eneflet, P.(t+h) = P{N(t+h)=n} = P{N() = pas t+h)— 
NC = 0} + ANG = n PINCE +) - NO = 1 + 2 PEN = 

a = EJPEN(E + h)— NO = k} = PO — Ah + o(h)) + Pa (ER + 
oh) +o(k) = PA(#1— Xh) + Pa (OR +o(u)). D'où PACE) En | 


h 

—À Pat) + À Pn-1(#) + +0) En faisant tendre À vers 0, on trouve P{(+) = 
—À Pat) + APa1(t) pour n = 1,2,...; de plus, P:(0) = 0 pour n = 1,2,... 

(b) Avec la même décomposition que dans (a), on obtient : Paft + 
h) = Paft)(1 — Xno(h) + o(h)) + Pa1(t)(An-1h + o(h)). En faisant tendre 
k vers 0, on trouve : Pf(t) = —)u Pat) + An; Pnmi(t) pour n = 1,2,... 
Pour n = 0, à vient Pot +h) = P{N(t+h) = 0} = P{N(t) = 0} 
x PLN(GE + h) — N(t) = 0} = Po(t)(1 — Aoh + o(h)). D'où Pj(£) = —Ao Pot). 


. Noter que, 
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(c) Si no = 1, alors Pj(t) = 0 et Pp(t) est constant, mais comme 
Po(0) = P{N(0) = 0} = 0, cette constante est nulle. Pour n > 0, posons 
Qn(t) := Palthe". Le système différentiel, satisfait par les P,(t), devient 
pour les Q,(t) : Qt) = (n—1),e tQ,_1(#) pour n > 1 et Qf(t) = —AoQo(t). 
De plus, QA(0) = 1sin = let Qu(0) = 0 sin > 2. Par intégration, on obtient, 
par récurrence sur n : Qn(t) = (et —1}%-1, d'où P,(t) = e7 {1 — e7Atjn-1 
pour n > 1. Comme Pp(t) = 0, la fonction génératrice de N{t) est égale à 
Gifs) = D ef — er jrelon = se] — (1 — e7À))- 1, Si no > 2, 

n>l 


on peut supposer que le processus est régi par la somme de nç tels processus, 
ayant chacun un seul top initial en £ = 0 et qui sont indépendants. La fonction 
génératrice est alors (G14(s))"°. 

4.7 (a) Comme la densité de U est (1/t)log, on a: P{U+X >t} 
Q/t) JÉPEU + X > élU = s}ds = (1/4) JP{X > t—s[U = s}ds 
(1/6) RPIX 2t—s}ds= (1/6) fér(t— s) ds = (1/4) fér(u) du = 76. 


N() 
{b) Pour & > 0, posons Yi := L5,4x,>14. Comme Q(t) = E on a: 
hu) = Efu90 = Z P{N( = n}Efu@O IN (8) = n] = ZX P{N(O = n} 
n>0 #20 


ul 


x Epét [NC = n] = X PEN = a}EL IE 2% |N() = 2]. Or, 


2 k=0 
conditionnellement à {N(£) = n} (n > 1), le système (S1,..., Sa) est distribué 
comme l'échantillon ordonné d’un système (U1,...,U,) de variables aléatoires 


indépendantes, uniformément réparties sur [0,t]. Pour 1 < k < n, posons 
ñ 
Zk := Tjusrxs>. On obtient : h(u) = D P{N(EH = n}E[fux] = 
nz0 k=1 
D P{N(+) = n}(Elu4]}". Or Z est une variable aléatoire de Bernoulli, 
n>0 


de paramètre P{U, + X1 > t} = F{t). Donc Elu] = 1 — F(t) +uF(é) et 
hu) = ZE (ee M(XE)/nt)(1 — Ft) + ur)" = er MF -0), 
n20 


(c) On peut encore écrire A(é) = e7"@U-u), ce qui montre que Q(t) 
suit une loi de Poisson de paramètre m{t). 


Remarque : Lorsque t tend vers l'infini, on a Q(t) Æ, V, où V est une variable 
aléatoire de Poisson, de paramètre ÀE[X]. En effet, lorsque + tend vers l'infini, 
on a : m{t) = À fé r(u) du + À ff% r(u) du = AE(X]. 
48 (a) D'abord, P{N(t + h) — Nft) = O[N() = n} = 1 - P{N(G + 
h)- NE) > LIN = n} — {NC + h)— NG) < —IIN() = n} = 
1— }nh + mh + ofh). Ensuite, pour n > 1, on trouve P{N(I+R) = 
D} = (1 — Anh — Bnh)Pn(t) + Anh Pa (t) + En+ihPn+1(6) + oh), puis 
P{N(G+R) =0}= (1 — oh} Po(t) + 1h Pi(E) + o(h). 

(b) En faisant tendre À vers 0, on trouve bien le système différentiel 
annoncé, 
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(c) Avec À, = nÀ et jm = ny, le système différentiel se spécialise 
en: Po) = Rx +) Pa(e) + (n — 1) APa(e) + (n + DiPan(E) (n 2 1); 
PIE) = Pit); Pa(0) = Onnos ce qui conduit à l'équation aux dérivées 
partielles annoncée pour la fonction génératrice de N(t). Sa résolution peut 
se faire à l’aide de la technique des intégrales premières. 


CHAPITRE 5 


5.1 (a) En dehors de la valeur propre 1, la matrice P a la valeur propre À # 
1 solution de det(P — À F) = 0, soit X? — À(2 — à — B)+1-— a — 8 = 0, c'est- 
à-dire À = 1 — o — B, auquel on peut associer le vecteur propre (a, —/), d’où 


s=(i %)«s- 3 (4) 
Def) Go-ro)ars (ES) 2361) 
+ ee (% F3) tin Pr - (6) 


5.2 m0 On a na det(t up), = (1-4)? + (a+ Bju(1 — u) et 
u- 1—-u+uf u8 ) 
EN CETTEr) ua 1-u+ua 
Pi, " ) 1,2 na 
,1(u) pou 
(b) Après ts manipulations, on peut obtenir 


piilu) = GTA a +5 


pai(u) = . ar À Ze Pur t- a— 8)" et des expressions analogues pour 


pao(u) et mat) à retrouver les expressions de l’Exercice 5.1. 


1-a1-a « 
5.3 (a) D'abord, 1 est valeur propre et P—(a—1}1= Ê -al-a «à ) 
1/3 1/3 4/3-« 
—1/3+a 1-a « 
est singulière, ainsi que P — & —o)1= ( 1-a —1/3+a 1) , puisque la 
1/3 1/3 « 
somme des deux premières colonnes, multipliée par a, est égale à la troisième 
colonne multipliée par É 
(b) On vérifie chaque fois l'identité P -v = Av, lorsque v est le vecteur 
proposé (écrit comme j'en coionne) pour la valeur propre À. 


(c) Ona:$5-1= 
{d} Avec la matin diagonale D = diag(L, aæ—1,1/3- a), on a: 
P* = SD"S8"1. Posant 8 := à — 1 et y = L-a,6 := 2 + 3a, on calcule 
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explicitement : 


2+68" +3ay* 2—68 +3aÿ" 6a-6a7 
28P° = | 2-68" +3a7y* 2+065° +3a7ÿ" 6a — Ga" |. 
2-27 2-27 6 + 47" 


113@ 
1 
Comme lim, 8° = lim, 7° = 0, on trouve lim, P* = 5 Ë 1 ) .On a bien 


uP = u, avec u = (1/6,1/6,3a/6). 113 
5.4 Soit Eo := f"-I(E); si à € Ep, alors f(i) = à; réciproquement, 
cette relation entraîne à = f{i) = f?{i) =... = f"-l(;), d'où à € Æo. 


Par conséquent, pour tout j € Æ, il existe un point fixe à de f tel que 
f-1(j) = à. Toutes les matrices Pm sont identiques pour m > n — 1. Soit 
(ai) (1 < i,3  n) la matrice P;n-1. Sa colonne d'indice j est nulle si j € Eo; 
si j € Eo, on à &,j = 1 si f*"1(i) = j et 0 autrement. 

Le graphe associé à Fexemple et la matrice limite sont les suivants : 


8 0050000100 
| 3 0 0 0 0 0 0 1 0 0 
2 0000001600 
N7 | 0 0 5 0 0 1000 
1] ç my Pyn =] 0 0 0 0 0 0100 
5 0000001000 

1, 5000000100 
3 46 0 0 0 6 0 0 1 0 0 

5000001000 


55 (a) En effet, on a : pl = P{X, = ij= D P{Xo=k,Xn mi} = 
CE 
E P{Xo = 6} P{Xn=ilXo=k}= D ap). 
keE kCE 
(b}) P{Xm =, Xn = j} = P{Xn = P{Xn = 5 Xm = i} = 


PLXin = EP {Xe = 5 A0 = à} = AP pr 


æ 


5.6 (a) Tous les états communiquent. C'est clair! 


{b) Un nombre pair de transitions est nécesaire pour aller de l'état 0 
à l'état 0, donc rÉe #2 0. Pour évaluer Fra ), on note que les chemins qui 
conviennent doivent avoir n transitions à gauche et n transitions à droite. Leur 
nombre est évidemment (?) et ils ont tous la probabilité p(1 — p}", d’où la 
formule pour pe ) 

(c) Avec nl + (n/e)"V27 n, on obtient : 


on CPE ne pp à GP" 


Poo © (n/e)m2rn 


Les séries de terme général PE ) et (4p(1-p}}"/ T7 ont même comportement. 
Or dpi -p)=lsip= È et 4p(1—p) <1sip# à Par conséquent, la série 
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de terme général vi ) diverge si p = i et converge si p # L On applique le 
critère de récurrence (Théorème 5.6.2). 
(d) ne a: (à) = 4° (1/2)h/n!, où (a), désigne la factorielle montante 
< +l)---(a+n—1)sir > 1 et 1 autrement. Il en résulte Poo(s) = 
AS DENTS gs = (1/2 (4pgs)" = (1 — 4pgs?) V2, per le 
R>0 
théorème binomial. : 

(e) Par la formule (6.9), on a : Pao(s) = (1— Foo(s})"!, d’où Fo(s) = 
1-(1-—4pgs?)1/? et Foo(1) = 1 si p = à et Fho(1) < 1 sip % à. L'état D (ainsi 
que tout autre état) est donc seulement récurrent lorsque p = L et transient 
autrement. 


5.7 Pour che des d composantes, on à pp) n 1/77, d'après 


l'Éxercice 5.6; d'où 2 0, 0..0 + (1/7), qui est le terme général d’une 
série qui diverge si d < 2 (récurrence) et qui converge si d > 2 (transience). 
5.8 Il suffit de montrer que P{Xh41 = 1[Xn = 0,Xn-1 = 1} est 
différent de P{Xny: = 1/[X, = 0}. Or, l'évènement {Xny1 = 1, Xn 
0,Xnu1 = 1} = {Ya + Ynyo = L,Mn et Ya: de signe contraire, Yn_1 
Yax1 = 1} est vide, donc de probabilité nulle. Par conséquent, P{Xa41 
1/X, = 0,X41 = 1} = 0. Au contraire, P{Xau1 = 1[Xx = 0} 
P{Xn = 1 Xn = O}/POXn = 0} = P{Yaye = Yan = 1, 
—1}/P{Ya et Yi1 de signe contraire} = p?g/(2pq) = p/2 > 0. 

5.9 (a) Évident. 

{b) Le calcul de P{Xy41 = j| Xn = } dépend du signe de D, — C, = 
—Xn+3-— Ya. Pour Da — On > 0, soit Y, < 3 — Xh, on obtient : 
P{P<2}=1, pirsl; 

P{Ya<1}=1/2, pos =1/2; 
P{Ys <0}=1/2, psa= 1/2; 

ü=4,j=5, P{Ya<-1}=0, pas=0. 
Pour Da — Cn < 0, soit Yn > 3— X,, on obtient, de façon analogue, p1,0 = 0, 
par = 0, paz = 1/2, pas = 1/2, p54 = 1. Enfin, pour D, — Ch = 0, soit 
Ya = 3— Xn, on trouve 1,1 = 0, pa,2 = 1/2, pa,3 = 0, pas = 1/2, p5,5 = 0. On 
en déduit la matrice de transition 


WUUUHR 


1,2 3 4 5 

1/0 1 0 0 0 
210 1/2 1/2 0 0 
P= 3/0 1/2 O 1/2 0 
alo O0 1/2 1/2 0 
5\0 0 0 1 0 


Il y a trois classes indécomposables, les classes transientes {1}, {5} et une 
classe récurrente {2,3,4}. 
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CHAPITRE 6 


6.1 (a) Se reportant à (6.3.4) avec a = 4 et en notant 4; la probabilité 
d'atteindre a4 à partir de a, on trouve : @ = (1—(g/p})/(1-— (a/p)*, lorsque 
pet i/4, lorsque p= À (i=1,2,5). 

(b) Par un simple comptage, la probabilité que À gagne en arrivant au 
score (50,0) (resp. (50,15)) est p{ (resp. 4p{a). 

{c) Pour entrer dans l’ensemble clos {ao, a1, 42, as, aa} par & = (80, 40), 
il faut être passé en (15,40) dans l'étape précédente. D'où p; = 4pq°p. Puis, 
pa = (Ophe? et pa = Agp'q. 

(d) D'abord, l'évènement A1 := {T1 < min{7»,73}} entraîne {X5 = 
(80,40)} et 43 = {T3 < min{T1,72}} = {X5 = (40,30)}. De plus, ils sont 
antérieurs à 5. De même, A2 := {T2 < min{Ti,73}} = {X4 = (30,30)} et A2 
est antérieur à 4. Soit A4 l'évènement «le score atteint (50,30) ». Notons P la 
probabilité de la chaîne à partir du score (0,0). On a : P(A4) = P(A4 A1) + 
P(Aa A2) +P(A4a A3) = P(Aa| A1)P(A1)+P(A4 | A2}P(A2)+P(A1 | A3)P(A43). 
Or, il vient : P(Aa| A1) = P{AlX5 = (40,30), A1} = P{A4!Xs = (40,80)} 
et comme A4 est postérieur à 5, la chaîne a atteint l’ensemble clos. On 
obtient : P(A4! A1) = gr. De même, P(Aa| A) = — pa et P(Aal A3) = gs. 
D'où P(44) = gpi + papa + aps = (10p° — 20p* + 10p°)/(1 — 2p+ 29°), une 
quantité qu’on ajoute à p* + 4p#q pour trouver la probabilité que A gagne le 
jeu, lorsque p # à Notons que lorsque p = k on trouve à pour la probabilité 
que À (ou B) gagne le jeu. C’est aussi la valeur de F{p) = En pour p= À. 
L'identité F(p} + F(1—p} = 1 signifie que le jeu se termine presque sûrement 
en un temps fini. 

1/2 1/6 1/6 1/6 


1/2 1/4 1/4 
62 ()P=[ 0 12192] (rer | 9 12120 6 sn 
0 1/2 1/2 0 0 1/21/2 
0 1/2 O 1/2 
y a une classe transiente {0} et une classe récurrente {1,2,...,r}. La chaîne 


est apériodique. 
{b) Pour r = 2, le polynôme caractéristique de P a les racines 1, 


0 1/21/2\ /0 O O\ /O 1 -1 

Let 0, d'où P = | 1/2 0 12) C 1/2 ) F —1-1]. On en tire : 
—1/2 0 1/2} \0 0 1/ \o ti 1 
1/2" 1/2 — 1/94 1/2 — 1/9 0 1/2 1/2 

Pr = ( 0 1/2 1/2 ) et C 1/2 12) pour la valeur 
0 1/2 1/2 0 1/2 1/2 


limite lim, P*. 

(c) Pour déterminer ff, il suffit de compter les chemins allant de 1 
à 1 en n transitions, sans passer par 1. Or, pour un tel chemin, la première 
transition est 1 2 et la dernière r +1. Un tel chemin est caractérisé par la 
suite (é2,13,...,1,#) des instants où le processus se trouve pour la dernière 
fois en 2,3,...,(r—1),r. Comme 1 < i2 <i3 << <i=(n-1),iya 
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M2) tels chemins de longueur n et Et = (24/2) (n > r) et 1 1 = 1/2. 
La fonction génératrice de T1 vaut 


; n—2\/s\n 5 s\r S\-r. 
co=5+L(T)O" 5 CD" 


d'où l'on tire EfT\] = @(1) = r, ENT — 1)) = G"(1) = 2r(r — 1) et 
Var Ti =r(r-1) 


(d) Comme 6 est transient, pour tout état à, on a : lim, n9 = 0. D'autre 
part, la chaîne n’a qu'une seule classe récurrente. D’après le Théorème 4.4, il 
existe une loi stationnaire (xp, 71,...,7) unique telle que 7; =); rip; (0 < 
j < r), un système qui se récrit : mo = 0, m1 = (mi + m4), mj = AGE +75) 
@<3j<r). D'où x = 0 et 7; = 1/r (1 < 3 < r). Maintenant, l'unique 
classe récurrente est apériodique. On peut donc appliquer le Théorème 6.1 


et conclure que, pour 1<ÿ<r,ona Pi — 7m; = 1/r lorsque n tend vers 
Y'infini. 


6.3 Tous les états communiquent. Le processus est donc irréductible. 
Les états sont ou apériodiques, ou périodiques de période 2, selon que r est 
impair ou pair. Le processus est donc ergodique si et seulement si r est impair. 
La matrice P est bistochastique. D'après le Théorème 6.7.1, le processus admet 
une et une seule loi de probabilité stationnaire, la loi uniformément répartie 
(1/r,...,1/r). La fréquence asyimptotique moyerine de séjour dans chaque état 
est 1 Jr et le temps moyen de retour dans chaque état est r. Il est à noter que 
ces résultats sont indépendants de p (0 < p < 1). 


6.4 (a) La matrice de transition est donnée par la matrice P ci-après. 


1 2 3 4 5 6 7 8 9 

1/0 1/2 0 O © 1/2 0 © 0 
2/1/3 0 1/3 0 1/3 0 O0 © 0 

3] 0 1/2 0 1/2 0 0 0 © 0 

41 0 OO 1/3 O0 1/3 0 © O0 1/3 
P=56| 0 1/4 0 1/4 0 1/4 O 1/4 0 
6!1/3 0 0 D 1/3 0 1/3 0 0 

7 0 6 © 0 © 1/2 0 1/2 0 

8| 0 0 o o 1/3 0 1/3 0 1/3 
9\0 o 0 1/2 0 0 O© 1/2 0 


{b) Tous les états communiquent et sont de période 2. Le processus est 
donc irréductible, maïs ä n’est pas ergodique. 


(c) Il y à une et une seule loi de probabilité stationnaire. La résolution 
du système 4 P = semble inextricable. Or, on sait que u; est la fréquence 
asymptotique moyenne de séjour dans le compartiment 7. On peut imaginer 
que ce temps de séjour moyen dans un compartiment est proportionnel 
au nombre de portes de ce compartiment, autrement dit, que les u; sont 
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proportionnels aux composantes du vecteur (2,3,2,3,4,3,2,3,2). En effet, on 
vérifie facilement que 


u— 


2 3 2 4 
( 3 3,222 


est solution de u P = u. C'est donc la seule loi de probabilité stationnaire de 
la chaîne. Notons que les temps de séjour moyen dans les compartiments sont 
donnés par les inverses des composarites du vecteur 4 précédent. 


6.5 Pour tout n > 9, désignons par X, la distance qui sépare les deux 
coccinelles à la date n, où encore le nombre minimum d’arêtes de l'hexagone 
entre les deux sommets où elles se trouvent. La suite (X,) (n > 0) est une 
chaîne de Markov homogène, dont l’espace des états est E = {0,1,2,3} et la 
matrice de transition P, ainsi que le graphe associé sont donnés ci-après : 


0 1 2 3 0 15 2 
0/1/2 O0 1/2 0 1209 +704 
1[ 0 3/4 O 1/4 1 3 
P= 1/4 
211/4 0 3/4 0 nn so 


3\ 0 1/2 0 1/2 


Il y a deux classes indécomposables {0,2}, {1,3}, toutes deux récurrentes. 
Désignons par d ia distance initiale qui sépare les deux coccinelles. Il s’agit de 
calculer le temps moyen qu’elles mettront pour se rencontrer pour la première 
fois, soit Mao. Les relations Mia = Mso = +oo sont immédiates. Pour 
déterminer Moo et M2, il suffit de considérer la restriction du processus 
1/2 172 
1/4 3/4 
restreint, qui a un nombre fini d'états, est irréductible; donc, pour tout 4,7, 
on a: M; < +oo. Or, les M; vérifie le système : M; = 1+ pie Me 
kAj 


à l’ensemble {0,2}, dont la matrice de transition est ( . Ce processus 


(i,j € {0,2}). En particulier, Moo = 1 + EM20 et Mao = 1 + M0, d'où 
Mo = 3, Mio = 4. 
6.6 (a) Le processus (Y;) (n > 1) est de Markov. En effet, supposons que 
l'évènement {Yh-1 = (i1,42)} soit réalisé. Alors, comme le processus (X,) 
(x > 0) est de Markov, la loi de probabilité de YA, conditionnellement à Y,_1 
est déterminée. On a : 
. . 0 si ja; 
= Yi = = ? . + 
PO = Gi) on = nie {0 Ge 
(5) On a à PLV, = (6 ÿ)} = PLXe à = EFP{Xn = ln = à} = 
P{Xa-1 = i}pi,;. Comme le processus (XA) (n > 0) est ergodique, il existe 
une et une seule loi de probabilité stationnaire à = (uz), on en déduit : 
lin PYa = (6,5)} = pis. 
6.7 Comme on est dans le cas fini, il existe au moins une loi de 
a 


probabilité stationnaire u. Elle vérifie u = uP, ou encore 4 = } wpig 
#0 
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{i = 0,1,...,a), ce qui donne le système : 49 = üo + qui, Ui = qua, ... , 
Ur = pur + que (2Sk La—2),... , Ua_1 = Pua-2, Ua = Püa-1 + Ua. La 
première équation donne u1 = 0, d'où w %a_1 = 0. La première et 
la dernière équations donnent up = wo et u, = %,. Les quantités wo,u, sont 
donc indéterminées. Les quantités up et w, sont indéterminées. Pour tout & 
tel que 0 < a < 1, le vecteur u := (a,0,...,0,1—#«) est une loi de probabilité 
stationnaire. [1 n’y à pas unicité (il existe, en effet, deux classes récurrentes). 
On constate également que toutes les lois stationnaires sont portées par les 
classes récurrentes {0}, {a}. 


6.8 On considère un ensemble de (mm +1) états Q,1,...,m, symbolisant 
les nombres de vignettes collées dans l’album. Après le premier achat, on passe 
de l'état 0 à l'état 1, avec une probabilité égale à 1. Si l’on est dans l’état 1, 
on peut y rester, avec une probabilité àgale à 1/m (on rachète la vignette que 
lon à déjà), ou passer dans l’état 2, avec une probabilité égale à (m — 1)/m, 
et ainsi de suite. Il s’agit donc de considérer une chaîne de Markov homogène 
dont la matrise de transition est donnée par : 


0 1 2 se. {m—2) {m-1) m 

0 0 1 0 ve 0 0 (0 
1 [0 1/m {ml)/m 0 0 n 
2 9 0 2/m ee Le) 0 Le) 
m2 |0 1 ô - (m—2)/m  2/m û 
m-1\0 1 0 . 0 {m—1}/m 1/m 
Lu (1) 1 0 û 1 


Dans les notations du Théorème 6.2.3, le temps moyen E{T] est le nombre 

Mom. I s'agit de chercher à évaluer ce nombre à l’aide du système : Min = 

1+ D pi Miam (G = 0,1,...,m — 1), qui se récrit : Mom = 1 + Mim, 
F£ 


mn 
Mim = (m/(m —1)) + Mom Mam = (m/{m 2) + Mams  ; Mn-2m = 
(m/2) + Mn-ims Mm-im = m. On en tire : Mom = 1 + (m/(m — 1)) + 
{m/{m-2))+...+m/2+m=mHm. 


6.9 (a) D'après la Règle 5, E[T] = E[ENT | X:]] = BA sil 
ZE ATX = EE ps + Ep + BAT) 214 E ms ITI. 


16Tra 3€ Fra 

(b} D'après le Théorème 6.2.3, on le système : E![T] = 1 + 
PET}, ET) = 1 + pE°[7] + qE![T]); ET} = 1 + qE?[7], qui a la 
solution unique El{T] = (1 + 2p?)/{1 — 2pq); Er] = = 2/{1 — 2pq); ES[T] = 
(A + 29)/(1 — 29). 

(c) Soit T le temps d’atteinte dans l’un des états de fin de jeu. Alors 
EGO15) pr] = 1 + gEU%0)}T] Or, EU030 [7] est précisément égal à ES[T] 
de (b). Par suite, EUC19IT) = 1 + g(1 + 2q°}/(1 — 2pq) = (4 — Ip + 8p? — 
2p°)/(1 — 2p +2p°). 
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{d) Directement sur le graphe de la chaîne, on calcule les probabilités 
PG015){T = n} et on trouve pour fonction génératrice : Gr(s) = ps + pgs? + 
g{p? +a?}s4/{(1—2pgs?), d’où l'on tire encore la valeur de Et019/[T] = GE(1). 
6.10 Considérons un vecteur propre (x1,...,2,) associé à la valeur 
propre À, de sorte que (À — mir = D piges (i = 1,...,r); en posant 


K 


fi 
üpfti}, on obtient [A — pis [ri] < K 2 Pi = K(i-pii) (=). 
= er 


Soit À un indice satisfaisant 1 < k < r et |x,] = K > 0. En écrivant la 
précédente inégalité pour à = h, on obtient : [À — pyx| < 1— pan. On en 
déduit : [A — uw) < JA — pp,nl + lpaa — 0] € (1 — pan) + (pin —w) = 1 —w 


CHAPITRE 7 


7.1 On vérifie que les conditions (a) et (b) de la Définition 7.2.1 
sont bien satisfaites. D'abord, E[[Xh[] < 2no? < +; ensuite, on a 


2 
EX Yo...) = Eau + 2 M? — (n + 071%... Vel = 
EF; Ba + Pan À Ye + (3 Vo? —(n+1)071%6,..., Me 


Elu + Mu À Ye + Xn — 0?|Yo,...,Y]. Or, Eu Yo... Ya) = 
El] = 0°, car V2 est ur de (Yo,...,Yh). On obtient en- 
suite : E[2Yn+i È el. =AÈ K) EP a D = AË Yi) 


x En] = 0, utilisant successivement la Règle 4, le fait que les A sont 
indépendants et la Règle 1. Enfin, E[X, — o?| Yo... Xl] ET — o?, d’après 
la Règle 2 et la Propriété 7.2.1. Ainsi, EfXu41 | Yo,..., Ya] = 

7.2 D'abord E[|XA|] < +oo (il suffit, en fait, de supposer que f est 
bornée). Puis, E[Xu41 | Yo,..., Vel = EjfoYn1] Yo... , Ya] = E[foYa1|Yal, 
en vertu de la propriété de Markov. Ensuite, E[f o Yh41|Ya = à = Erfü). 


D'où E[f o Ya4: | Yn] = Er, 410)= Fo Ya = Xn, puisque PS = f 


73 Voir solution du précédent exercice. 
T4 (a) On à Snyr = Sn + Var et Sn et Yn+1 sont indépendants. D’où 
PESn41 = En+ilS0 = Ko... , Sn = En} = P{Snai = Ens1| Sn = En}. Puis, 
Diÿ = P{Sny1 = | Sn =i} = PES +Yansfifei} = Pan -il= 
1} = Pfau=t—i} = 4; puisque Ÿ,.1 et 5, sont indépendants. 

{b}) En effet, 
Zi M = = È&- se = Eat} = = e" Eu = = etig(u) = g(ujeti. 


(c) Il Sufit d'appliquer le résultat & l'Exercice 7.3. 
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7.5 D'abord, E[XA]=(Ef 0 Yo/f00 ol)" = (JU (u)/ Pol) folan du)" = 
{J fi(y) du)* = 1. Ensuite, 
EfXa4i 1 Po... Ya] = E[Xn (fi 9 Yn1/fo 0 Ya41)1 Yo... Ya] 
2 XAEf(f1 0 Vasr/fo 0 Vayn)| or Val 
= Xh E[(fi 0 Ya+1/ fo 9 Ya+1) 
{puisque les Y; sont indépendants.] 


=X, [AGIR P)du = X, | Gay 


= Xy. 
7.6 D'abord, E[|X;[} = [cE[I% al] = IAE} EM] < 
+00; puis, comme la variable X, est une fonction des seules 6, ... , Ya, 
on a, d’après la Règle 4 et l'indépendance des Yi : E[Xa411Yo,...,Yal = 
ELXn Yet | Vos, Val = Xn [Vas | Vo. Ya] = Xa Effail = Xn. 
77 Les variables aléatoires e"Ÿ* /g{u) (n > 1) sont indépendantes et ont 
même distribution et X,, = (e""i /g{u)) -:: (etY*/g(u)). 
.8 On prend £ = E[X] dans l'inégalité : @(x) > A(x — €) + (€). Alors 


bo X] = [o(x)dPx(r) > À f(x — E[X]) dPx(z) + J'e(EIX)) dPx(x) = 
(E{X]). On prend ensuite £ = E[X |Y = 7], on multiplie l’inégalité initiale 
ar la densité fx](x|y), puis on intègre par rapport à la mesure dy. 

9 Pour tout > 1,ona:E[|X,|] < nE{|Y1f] < +oc. Puis, 

Au nee Val = EUX + Yoan see Val = An + Elo {Mio Val 
ar linéarité et par la Règle 2, soit encore Xa + EfYn41] = Xn + y, puisque 
es Y, sont indépendantes et de même loi, une quantité qui est > Xn, < X», 
Xn. suivant que pr > 0, u < 0, u = 0. 


10 D'abord E[{Xul]= X EYE] < +oc. Puis, E[Xn1l,..., Ye = 
1<kEn 


7 

Ef(Sa + Yi) |V,..., Va] = E(S2 + 284Ynur + VEilYn..., M] = S2 + 
28h EYnat | Vis... Vi +Efr2 F2 Yis.e, Ya] par les Règies 3 et 4. Ensuite, en 
vertu de l'indépendance des }4 et du fait que les Y4 sont centrées, on obtient : 
EfXenlVe.., Ya] = 62 + 26 EfVani| M... Yo) + EV2] = 2 + 
E. 
À. 


FT EDES HN 


Il 


halV. Val > SX 
utre démonstration : d’après la Proposition 7.2.5, la suite 6 n) (n > 1) est 


une martingale par rapport à (Yan) (n > 1). Or g:æ + x? est convexe et 
= (5h) = po Sa. Par ailleurs, Ef( o S,)*] = Ef(S2)*} = E[S2] = 


X, 

EfVar 8] = È Var Y, = È E[Y?] < +00. D’après le Lemme 7.4.1, la suite 
( 

7 


Xn) (n > D at donc une ne martine par rapport à (YA) (n >1). 


11 D'abord, E{Ya|] < : D EiiXi1l] < +oo. Ensuite, comme Ys_1 = 
É=1 


on à EfYn-1 Va, Yaæ1s- Elan | Vas Yatse.] — 


n 
1’ 
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1 n 1 
EX ooane] = Ve = EU (Yo Vans), d'après le 
Règle 4. Or, puisque les variables aléatoires - X1,..., Xa sont indépendantes et 
identiquement distribuées, E[X1 ! Ya, M1,...] = «+ = E[Xa Ye, Yaga,...), 
. 12 
d'où Ya = EfYe|YnYasn,...]= ne EP PV Yen] E[Xn | as Vars, 


..], d’où, en définitive, E[Yn-1 | Ya, Yag1,...] = Yi = 


ni ni 
CHAPITRE 8 


8.1 La comparaison entre E[Xo] et ElXr] a été démontrée dans le 
Théorème 7.2.1. Il suffit de comparer seulement E[X7] et E[Xy]. On a 
=Q E LTD XT = 2 TXT = Er d'où E[Xr] = 


DD Er x} Xl. De même, EL D Er Xu]= 


0<kEM O<EEM 

«E 2 HEUer- eg Xm Yo... Y]] = Etre, ill, car 

chaque indicatrice Tr est une fonction le (K,...,Yx). D’après la Pro- 

priété 7.4.4, on en tire E[X x] =  E Er Xl (resp. > D Elir-uX4l, 
OEM 


resp. Es ZE Etre a X)), si x Ed une martingale (resp. une sous-martin- 


gale, resp. une surmartingale). 


La variable aléatoire T'An est un temps d’arrêt borné (M = n}. Pour obtenir les 
relations pour le processus arrêté, il suffit done, dans les relations précédentes, 
de remplacer T par T'An et M par n. 


8.2 La variable aléatoire T est un temps d’arrêt du processus (Y,) et 
suit évidemment la loi géométrique, de sorte que E[T1 < +00. On est dans les 
conditions d’application du Corollaire 8.8.4. Comme évidemment Xy = 1, on 
a: i = E[Xr} = E[T)E(] = EÎT]p, d'où E[T] = 1/p. De même, Xr = r et 
r = EDEN) = El) p, d'où E(T) = r/p. 


8.3 (A) {a} On a toujours Xr = 1. Comme p = q = L on a Efr;] = 0 et 
aussi E[Xh] = 0 pour n > 1. Si l’on avait E[T] < +c, le Corollaire 7.3.4 
permettrait d'écrire : 1 = EfXr] = E[T}E[Y1] = 0, d’où une contradiction. 


Ainsi Ef7] = 

{b} En prenant U = XIT et V = 1, on peut conclure que 
P{T < +00} = 4. D'autre part, la martingale X = (X,) ne converge pas, 
puisque le terme général Y, ne tend pas vers 0. Or, sur {T = +00}, les deux 
martingales X et X |T coïncident. L'ensemble {T = +00} est donc négligeable. 


(0) On a: (1/07 + D)ÉH)Q/204) = (1/2) n41/(n 1) D'où 


TE V/2an/(n+ te GG DÉSIPES ESS 


22 . e Solitions des Exercices 


(B) On a : 1 = EjZo] = EfZran] > ElZranl{reny] = ElZrltrenyl = 
El(g/p)Tiçreml. Puisque Xr = 1, on en tire : 1 > (g/pEl{ren]l = 
(g/p)P{T < a d'où P{T < n} < p/g < 1. En faisant tendre n vers 
Pinfini, il vient P{T < +00} < p/g < L. Il en résulte que E[7] = +00, 
un résultat que l’on peut démontrer directement : si l’on avait E[T] < +00, 
d’après le Corollaire 8.3.4 (“les identités de Wald”), on en déduirait 1 = 
E[Xr] = ET] EM] = ET] (p — q), soit E[T] < 0, puisque p — g < 0, d’où une 
contradiction. 
(C)On a: Xn/n = (Mi+.+Y)/n ES EM] = p-q > 0. D'où 
Xn 2% +00. Comme T = inf{n > 1: X4 = 1}, on a bien T presque sûrement 
fini. Par définition, 1 > Xyan = Yi+-::+Yran. Comme E[T À n] < n < +00, 
on peut appliquer le Corollaire 3.4 : pour tout n > 1, on a : 1 > E[Xr«] = 
EÎT À n]E[M:] = EÎT A n](p — aq) et donc EÎT A n] < 1/(p — ag). Comme 
Test presque sûrement fini, on en déduit aussi que T A nEST. D’après 
le lemme de Fatou, on peut aussi en conclure que EfT] < 1/(p — 4). On 
spplne de nouveau le Corollaire 8.3.4 à Xr : comme E[T] < +co, on obtient : 


ElXr} = ET)EM) = EfT}(p — 9). D'où EIT] = 1/(p- 9). 
CHAPITRE 9 
9.1 On a : El = EjZ:] = CUS = (up) ET ir 
Puis, E[Zn+1 | Vos... Ya) = ElZa(a/p}41 | Yo... , Yi] = ZA E{(g/p}r+ Tk, 
Tale A E(Q/p) 0) = Za(plg/p) + ME Zn. 
9.2 Dans le cas p = q = 4 on a g(a,s) = 1—r, = a/s, qui, sous la 


condition s > a +1, est maximum pour s = & +1. Dans le casp #g,ona: 
gas) = 1-7, = @ — «)/(1— c*), avec ce := g/p. Lorsque 0 < € < 1, la 
fonction s > 1/(1— «°) est décroissante, ainsi que g{a, s), puisque 1 — € > 0. 
Par conséquent, g(a,s) prend sa valeur maximum pour s = a + 1. Lorsque 
e > 1, la fonction 8 + 1/(1— cf) est croissante, mais comme 1 — c < O, la 
fonction ga, s) est décroissante et on a la même conclusion. 


9.3 On a G'(x) = h(z)np/(1 — p%}2, avec h(x) = (a — s)p+e)e — 
ap — 8p%®. Posons p := (s— a)/s, g := a/s. Alors —h(x}/s = pp@ta) + 
gp — PE+a)etaur, Le second membre est positif, puisque la fonction p° est 
convexe. Donc —h(x) > G et G'(x) < 0. La fonction G{(x) est une fonction 
décroissante de x. 


9.4 (a) Il suffit de faire dans les formules (9.3.3) et (93.6) les substitutions : 
a+ æ-cetb+ d-2x. Pour obtenir P{TF < T®}, i suffit, dans PTE < T} 
de faire les substitutions : p+-q,q+-pet (d—-x}< (x-c). 

{b) En conditionnant par rapport à 1, il vient : 
P{us < +oo} = P{M = lue < +00} + P{M = tps < +00} = 
P{N = 1}P{ur < +oo M = 1} + PM = —1}P{ue < +oo[ M = —-1} = 
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pP{TEH < +00} + P{TE TT < +00}. En jiéilisant, selon les cas, les formules 
obtenues dans (a), on trouve : sip=gq= En alors p-1+gq:1=1l;sip/a<1, 
alors p +1 + q{p/a) = 2p; si p/q > 1, alors p{qg/p) + q +1 = 2q. Dans tous les 
cas, 2 min{p,q} 

{c) Supposons p/q < 1. Alors pour tout € > 0, on a P{M > t} = 

P{TP < +00} = (p/q}', qui est la fonction de survie d’une loi géométrique 
de paramètre g/p, sur tout N, puisque P{M > 0} = 1. Si p/g > 1, 
pour tout £ < 0, on a P{m < t} — P{TS < +00} — (g/p) *. Comme 
P{m < 0} = 1, la variable aléatoire m suit une loi géométrique de paramètre 
pa sur -N = {0,-1,-—2,...}. 
9.5 @) Si le joueur a perdu les n premières parties, il a misé —1 — 2 — 
22... 901 = 98 + 1, somme qu'il a perdue, donc X, = —2* + 1. Cet 
évènement a la probabilité 1/2". L’évènement contraire est {X, = 1} et il 
a donc la probabilité : 1 — ré Ainsi, x ne prend que deux valeurs et 
EXn] = (27 + 1)(1/27) + 1: (1 — 1/27) = 


(b} Pour n > 1,onaE{|XA{] = re (1—1/27} < 2. truite 

Ef[Xn+: | Xo, X1,. -, Xa] = ElXau | Xn] = (Xn + 27)h + (Xn 2) = 

(c) Comme {r =n}= {Xi <l,..,Xni < 1, Xn = 1} (n s 5, 

la variable aléatoire T est bien un temps d'arrêt. Pour n > 1, on a donc 

P{T = n} = (1/2)%-1(1/2) = (1/2)" et T a ainsi une loi géométrique de 

paramètre À sur {1,2,...}. De plus, P{T < +00} = ZE G/2) = 1. Comme 
ñ 


E[Xr] = 1 etE[X,] = 0 pour tout n > 0, le théorème d'arrêt n'est évidemment 
pas vérifié. Le temps d'arrêt T est presque sûrement fini. Donc, la seconde 
hypothèse du théorème d'arrêt, l'inégalité Efsup,,>0 [Xran|] < +00 n'est pas 
satisfaite. Le processus arrêté X IT = (Xra») (n > 0) n’est donc pas borné. 
Cela veut dire qu'avant de gagner 1 euro, le joueur peut perdre une somme 
illimitée. Il faut donc qu'il dispose de ressources illimitées à la fois en argent 
et en temps. Cette stratégie n'est donc pas recommandée ! 

o EXa41 | Xo,..., Xa] = E[Xa41 | Xa] = (Xn + 2)p + (An — 2°)g = 
Xn + (p — g)2". Cette quantité est au plus égale ou au moins égale à X,, 
suivant: que p < i oup> L 


CHAPITRE 10 
10.1 Noter que la suite (|X,[P) (r > 0) est une sous-martingale positive 
(cf. Lemme 7.4.2) et appliquer le Théorème 10.2.1. 


10.2 Pour tout c > 0, la suite ((Xn+c)?) (n > 0) est une sous-martingale 
positive. On applique le Théorème 2.1 en notant que l'évènement & Toax Xk> 


À} entraîne re max € (Xe +)? > (A+ c}?}, pour obtenir P{, max A È À} < 
E[(Xn + c}?]/ a 2, une majoration qu’on pose égale à g( Q. Où cherche une 
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valeur de c > 0 telle que g(c) soit minimum et on trouve e = E[X2]/À En 
reportant dans g(c), on trouve la majoration proposée. 


10.3 (a) Comme S,,1 est une fonction de Bt {c'est sa première com- 
posante!), on à : Sny1 = EfSa+1| nt] = È EX | Hu] = = n+t 
X ElXil Hat]. D'où Yu = EfXii Huy] = (1/n) È EjXi| ny] = 
Gin) 2 EXe [Ha] = EH) 


(b) La suite {[Y:|) est une sous-martingale renversée, positive, par 
rapport à la suite (H,). Il en résulte que la suite Ef!Ya[]) est croissante, 
lorsque n décroît vers 1, donc la suite E[|Y:{]) est décroissante, lorsque n 
tend vers l'infini. On peut appliquer le Théorème 10.3.2 : pour 1 < n < m et 
tout À > 0, on a l'inégalité : AP{ rain el > À} < E[|Yi}}. La majoration 

n£kém 
étant uniforme en m, on en déduit l’inégalité cherchée. 
10.4 Posons U := que X4. Alors E[U] = À + B, avec À := fé P{U > 
RER 


t}dt et B := [*°P{U > t}dt. D'abord, À < x; on applique ensuite 
à B = [POP{Ur > #P}dt = LS P{ mas XŸ > t}dt l'inégalité (2.1) : 
SkEn 


B < [ÉE(XA)/P at = ELXA L#°(1/2) dt = ELXPjæ 0 /(p— 1). D'où, 
EU] < glx) avec g{x) := x + ElX?]x @-0/(p — 1). On cherche une 
valeur de x > 0 qui rend gx) minimum et on trouve x = (E!X7)l/? = 
Xallo. La valeur correspondante de g{x) est donc g(|Xall) = [Xxl» + 
E[X2] ŒLXR) 6 9/1) = (p/(p - 1) HXalle. 

10.5 La suite (S,) (n > 0) est une martingale adaptée à (Y,) (n > 0). 
Donc la suite (82) (n > 0) est une sous-martingale adaptée à (Y,) {r > O). 
On peut donc lui appliquer l'inégalité maximale (3.1). En posant M, := 
Euex S? > À}, on sait que, pour tout À > 0, on a AP(M,) < EfS? Jar,]. 
En posant À := 2,6 > 0, on a M, := {max ISkl > €} et l’on obtient bien 

CRE 
l'inégalité cherchée. 


b 
10.6 Si0 < a < 1, il s’agit de démontrer l'inégalité : a Logb < = Celle-ci 


Log b 1 
est banale pour 0 < b < 1. Pour b > 1, il suffit de démontrer : 28 £ —. 
L Log 1 Ÿ 
gx 
Or, la fonction prend son maximum pour # = e; d’où en < : < æ 


b 
Si a > 1, it s’agit de démontrer l’inégalité a Log b < a Log a + —, c'est-à-dire 
e 


b 1 Lo, 
: Log <= D qui est satisfaite, puisque la fonction E? 


entz—e. 


prend son maximum 
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CHAPITRE 11 
11.1 En effet, pour chaque n > 6,on a E[iX,|]=E{|E[Z | Y,...,Ya]|] 
E[E{Z|1 Yo... Yi] = E[|Z|] < +oo par tes Le Théorème L1.LE 


s'applique : PASSA 


11.2 Pour chaque # > 0, posons : Z, := EfZ|Y0,...,Y:]. Comme 
Xn < Z et que (X,) est une martingale adaptée par rapport à (Y:), on 
a XL = Elo Val < EZ lo, Val = Ze Or, (Zn) (n > 0) est 
une martingale de Doob, qui converge presque sûrement, d’après l’Exercice 1. 
D'autre part, (Xn — Zn) (n > 0), différence de deux martingales, est encore 
une martingale, telle que pour tout n > 6 on a Xy — Z; < 0. D’après le 
Corollaire 11.1.5, elle converge presque sûrement. Donc la suite de terme 
général Xy = Zn + (Xn — Zn) converge aussi presque sûrement. 
113 Pour la martingale arrêtée X | ={Xan) (m > 0),ona {Sl"<n} = 
{5k <+oo} et {T}®<n}={T} <+oo}. L'inégalité de Dubins donne : 

Vk>1 (b—a)P{T{" < n} <El(a— Xn) Lislrener") 15 
soit VE > 1 (b—a)P{T < +oo} < El(a — Xn) HgetooTi=+oo) l3 d'où 
l'inégalité à prouver, puisque P{M > E}= P{Tz < +o0}. 


11.4 (a) Pour tout n > 1, la variable aléatoire X, est du premier ordre; 
n 

de plus, on obtient : E[X,] = [[ EfY} = 1: enfin, E[X/1/%,...,Yaj = 
&=1 

EXnYa41 Ve, Yale XnE[Yagi [Vis Yale XnE[Ya41]= Xn. 


(b) Pour le cas p := P{Y, = 0} > 0, on part de l'inclusion 
U {3 = 0} € {Xx — 0}. Il suffit alors de montrer que la probabilité du 
#z1 


membre de gauche de cette inclusion est égal à L. Or, PCU Ye = 0}) = 
P(lims D = 0}) = lim, PCÜ = 0}) = limy(1— PA 4 0})) = 
Kmn(l — ü P{Y 2 0}) = lima(i — (1 — p}") = 1, puisque 0 <1—p< 1. 

Dans le cas p = P{Y1 = 0} = 0, les variables aléatoires LogY; sont presque 


sûrement définies. Ï en est donc de même des variables Log X, = 57 Log Y4. 


=1 
Or, la fonction x ++ —Logzx est concave. D’après l'inégalité de Jensen, on a : 
0 = - LogE{Yi] < -E[Log Yi]. D'autre part, la loi de Ÿ: n'étant pas dégénérée, 
on a l'inégalité séricte ElLog Yi] < 0. Appliquons la loi forte des grands 


nombres : À Log Xn = = À Loe ES EL] < 0, d'où Log Xh F5 — Le] 


et par conséquent X, ++ 5. 
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Remarque 1 : Le seul cas où X, ne converge pas vers 0 est celui où la loi de Yi 
est dégénérée, c’est-à-dire 1 = 1 p.s. Pour tout n > 1, on a alors X, = 1 ps. 
pour tout n > 1, d’où X} 2, 1, lorsque n tend vers l'infini. 


Remarque 2 : La suite (XA) (n > 1) est un exemple d’une suite de variables 
aléatoires positives, toutes d'espérance mathématique finie et égale à 1 et 
pourtant telles que X, 2% 0, lorsque n tend vers l'infini. 


Remarque 3 : Si les variables aléatoires ne sont plus supposées identiquement 
distribuées, le présent exercice donne lieu au théorème des martingales “pro- 
duit” de Kakutani, dont le traitement n'est pas aussi élémentaire. Voir le livre 
de WiHiams.! 


11.5 (a) À la date n, l’urne contient (n + 2) boules, dont N, blanches. La 
quantité X, représente donc le rapport, à la date n, du nombre de boules 
blanches dans l’urne au nombre total de boules. D’abord, E[|X,[] = É[X,] < 
1 < +oo pour tout n > 0. Ensuite, conditionnellement à (No, N1,..., Na) 
(en fait, conditionnellement à N,), la probabilité d'amener une boule blanche 
à la (n + 1)% opération est N,/(n + 2), d'où E[Ns411 No, MN, , Na] = 
Na + (Naf(n +2)) = (n +8) Na/(n +2), soit E[Xa4: | No, N1,..., Ne] = Xa. 

(b) La martingale (X}) (n > 0) est bornée, puisque 0 < X, < 1 
pour tout n > 0. Elle converge donc presque sûrement vers une variable 
aléatoire X intégrable. Le rapport du nombre de boules blanches au nombre de 
boules noires après la r°"% opération est Na/((n +2) —N,) = Xh/{1-— X3), 
une quantité qui tend presque sûrement vers X/(1 — X) si X %# 1. [Le cas 
X = 1 peut, par exemple, se produire, lorsque l’on tire une boule blanche à 
chaque opération. Alors X, = (n + 1)/(n + 2) tend vers X = 1 et le rapport 
Xr/( — X3) = n+1 tend vers +00. 


CHAPITRE 13 


13.1 (a) On a Cov(X(s}, X(t)} = E[X(s) X(t)} = E[X(s)(X(s) + (X(t) — 
X(e)))] = E[X*(s)) + E[X(S)(X(#) — X(s))]. Or, X(s) et X( — X(s) 
sont indépendants. On en tire : Cov{X(s), X{t)} — EfX2(s)] + E[X(s)] 
X E[X(t) — X(s)] = E[X2(s)] = Var X(s) = 5. 

(b) La densité de X(s) conditionnellement à {X(#) = b} est le rapport 
A/B de la densité conjointe À de (X(s), X{£}) au point (x,b) à la densité B 
de X(t) au point b. Or, la densité de {X(s), X{£)) au point (x, b) est la même 
que la densité de (X(s), X(t) — X(s)) au point (x,b— x). Ces deux variables 
étant indépendantes, on à donc : 


1 -etjos), 1 1 (6-20). 


1 
AR VAR 


L'Williams (David). — Probability with martingales, Cambridge Univ. Press, 1991, p. 144. 
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8,12 
I 1 yen, Du À 1 1 1(e-5) 
= AV 7/09: soit ES 5 ep(-; (- 5 }. 
4 t 
| (c) D'abord, Cov((X(s), X(#)) | X(1) = 0) = E[X(s)X(#)|X(1) = 0]. 
Puis, EÏX(s)X(t)|X(1)] = Ex Ex EE (#74 (0 LA (#)], soit 
E{X (s)X (+) | X(1) = 0] = Ejxqr)=o) (Etxa)o}{X (8) X(#) | X(#)] = 
Eçxq)=0}[ À (t) Efxt)= at) xt t)} = Ex) 70 (s/t)X(8] = 
(PE aX ELA) = 0) = As PET 
13.2 P{ int X(s) < 0|X(0) = a} = Fan X(s) > 0[X(0) = -a} 
SEE s<t 


par symétrie. À cause de la propriété des accroissements stationnaires, cette 
dernière quantité est égale à P{ 2, X(s) > 0|X(0) = 0}, qui vaut encore 


P{Ta St} = (a/V3n) Jéu #2 ee qu, 


13.3 Pour a > 0, la formule résulte de l'exercice précédent, en vertu de 
la propriété des accroissements stationnaires. 


134  OnaP(B)= Î P{B|1X (to) = a} fixesy(e) da, avec fixtoy(a) = 


V2/{nto) e-%/U%) pour a > 0 et 0 autrement et où P{B| IX (to)! = a} n’est 
autre que la probabilité P(a) évaluée dans l’Exercice 3. On en tire : 


= 2 Î Po) e-%/20) da 
rto Jo 
2 pt _2 a t1—t0 2 
= —82/(2to) {_4 3/2 —a2/(2u) 
= [ e Ca ü E du)da 


RSR Î FR et /a)+ 0/0) qu. 
0 


Tr 


Avec le changement de variables 42/2 := x, la dernière intégrale vaut 
1/(Œ/u) + (1/t0)) = tou/(to + u). D'où, avec le changement de variables 
u = to? (v > 0), 


fo fi-to Vi-t)/to du 2 
2 f =2/ ——>5 = -Arct 
A +u)Vu +2 x 
On en tire : 


hi to 1= (to/h) 
te(ra/2) = 4 —© = ——. 
s(ra/2) = 4 ES 
fé 2 fo 
D’ — = = —. 
où & cos(ra/2} et a 7 Arecos à 
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13.5 Pour i = 1,2 on définit Bj;(t) par Xi(t) =: x; + Bi(t). Alors 
{B() : & > 0}, où B(t) := Bat) — Bot), est un mouvement brownien 
tel que B(f) est d'espérance (41 — H2)t et de variance (a? + &3)t. De plus, 
Xi(t) — Xoft) = (1 — x2) + B(+) et B(0) = 0. Soit TŸ le temps d'atteinte 
de c à partir de 0 pour le processus {B(t) : t > 0}. Les deux processus ne se 
rencontrent jamais si et seulement si le processus {B(t) : t > 0}, partant de 0, 
n’atteint jamais la position —(æ1 — x2) = x2 — 2, c’est-à-dire si l'évènement 
{Th x, = +oo} est réalisé. Comme P{TÈ,_,, = +00} = 1-—P{T9,_., < +00} 
et 2 — #1 > 0, on obtient, d’après (7.5) et (7.6), 


o 0, si 41 — po =0; 
P{T_,, = +} = 40 si u3 — po>0; 
rm 1 ea-mler-m)/(Ë+of) ai ui — po <0. 


13.6 Supposons d’abord y > 0. Si x « 0, alors P{Y > x} = 1, car Ÿ est 
positive. Si æ > O0, on a {Y > x} = fins X(E) < —x} = {T0, < +oo}, 


d’où, d’après (13.7.5), P{Y > a} = P{T0, < +oo} = e-2#/0?, La 

fonction de survie de Y est celle d’une variable exponentielle. Supposons 

ensuite y < 0. Six < 0, on à P{Z > x} = 1, car Z est positive. Si 

æ>0,ona{Z > x} = {sup X() > x} = {T® < +cc}, d'où, d’après 
t> 


(13.7.6), P{Z > x} = P{TŸ < +00} = e-2#it/0?, La fonction de survie 
de Z est celle d’une variable exponentielle, On voit que si ux < 0, on a 
P{TD < +00} = enrle? 1 et que si ur > 0 ou si = 0 et x quelconque, on 
a P{TÈ < +oo} = 1. 


13.7 (a) On écrit E[Y’{7/] = 0, soit E[{Y — 4 Z){7’] = E[Y Z/]- AE[Z {71 = 
Ti2 — AT 2 = 0. 
(b) Comme Y”’ et Z’ suivent des lois normales et sont non-corrélés, ils 


sont nécessairement indépendants. La matrice des variances-covariances de Y”’ 
vaut : D = E[Y'ÉY"] = Du — Lao Log Don. 


(@)Dna: P{A{K € B}|Z = +} = PLAY + AZ € B}}= 
û 0 
PLAY! + An € Bi}. 
i=l 


13.8 (a) Une manière de procéder est de dériver l'expression intégrale 
de J{t) sous le signe somme (la justification est aisée) et d'obtenir l'équation 
différentielle : Z'(t) = 0; on prend alors la limite de Z{t) lorsque + tend vers 0+. 
On peut aussi remarquer que si f est une fonction continue sur toute la droite 
(sauf éventuellement en 0), paire et intégrable, on à : fg fu — t/u) du = 

HS fu — tu) du + JU fu — tju) du = 2 fe F(u)(1/2 + v(u? + 48) 1/2) du, 
par le changement de variables v = u —t/u. Comme f est paire, on en déduit : 
fe flu—t/u) du = 2 ff fu — tu) du = 2 ff ® f(v) dv. La seconde intégrale 
se déduit immédiatement de la première. 
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{b) Prenons # := x,/s dans l'expression (8) de J(#}. On obtient : 
+ + EE ÿ  e-tv 
Ne == | ex] p(- 3(+ EE )) à u = € . 


En faisant le changement de variables € = e /(@u?), il vient 
+00 z 2 
—st —3/2,-22/(40) a = DE VS 
Î En - NE € dt=e : 
C'est l'expression de {b). 
(c) L'identité obtenue en {b) se récrit 
Le Ave = (x/2VPt 42e En, 
une expression que l’on pose égale à f(t). On en tire : 
Lle-(Vr+2s03-p}(x/o?) — œufo? p-1 ,—Vu+2802(x/0?) 
ele? pt -Vao%(stu3/(o2){x/o?) D Qaufo? -utt/(20?) p-3 -Vaots(ale?) 
eeule? e-n/@r") p-1 ee Val L eeulote-n4/(207)(02/9) f(to2/2) = 
eue en) (2/2) (x/2m)t-#/2(02/2)-8/2e-2°/ato?/2), soit l'expression 
de fro(t) de (13.8.4) : 


Fr @ = Ti an(s ( - aviÿ”). 


13.9 Pour tout entier & > 1, l'évènement {|X(1)| < 1/k} est réalisé si et 


a 
seulement si l'évènement n {Zi < 4/k} est réalisé. Pour & assez grand, on 
= 


à la double inclusion : fus +1/k<Y <bh—1/k,1Z] <t/k} c Aa < 


Mi+2 < hi < 8 © Alu UE < Ke < h + IAI < 6/8} 


En passant aux probabilités, on obtient une double inégalité. Divisons alors 
les trois membres de celle-ci par P{|X(1)| < 1/4}. Comme chacun des 
évènements {|Z;| < #4/k} (4 = 1,...,n) est égal à {IX(1)| < 1/K} et 
que Ÿ et Z sont indépendants, on obtient un encadrement pour la probabilité 


conditionnelle P{ À {eu < K+Z% < b}|IX(1)| < 1/k} de la forme : 


PLÂ Le +1/k << hi 1/4}} < P{Â {a < F+% < hu} | XCD < 
1/k} < P{ ñ {ai —1/k < Y; < b;+1/k}}. En faisant tendre & vers l'infini, on 
1 
en déduit : P{ {ai < Yi < bi} = P{ {a < Yi+ Zi € b} | IXG)| = 0} = 
1 il 


PA Le < X(t) < hi} | IX(DI 20). 
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Ce livre s'adresse aux étudiants en 2° cycle/Master de mathématiques 
appliquées et d'informatique, ainsi qu'aux élèves des grandes écoles 
d'ingénieurs, qui s'orientent vers la recherche opérationnelle. 

Il présuppose la connaissance d’un cours de probabilités de base, 
comme celui qui est exposé dans le livre Calcul des probabilités, écrit 
par les même auteurs. 

On y trouve un exposé sur les processus de Poisson, les chaînes de 
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dinemples d'applications, dans lesquels les différents processus sont 
utilisés. 
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